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本 书 “ 重 新 定义 ”了 持续 交付 ， 增 补 了 组 织 管理 和 架构 两 个 维度 ， 辅 助 以 真实 案例 ， 对 诸多 持续 
交付 的 原则 和 实践 加 以 解读 ， 并 对 持续 交付 过 程 中 的 取舍 原则 加 以 论述 。 
本 书 分 三 个 部 分 : 第 一 部 分 作者 根据 自己 近 十 年 的 工作 及 咨询 经 历 ， 通 过 不 断 总 结 、 提炼 和 反思 ， 
对 原 有 的 持续 交付 进行 了 修正 ， 重 新 定义 持续 交付 为 实现 组 织 战 略 目 标的 能 力 ， 并 引入 持续 交付 的 能 
力 模型 ， 第 二 部 分 阐述 组 织 打 造 持续 交付 能 力 模型 所 需 遵 守 的 原则 ， 包 括 基础 原则 、 组 织 原 则 和 架构 
原则 ; 第 三 部 分 通过 多 个 互联 网 公司 案例 的 解读 ， 阅 述 如 何 根 据 组 织 的 当前 状况 ， 应 用 相关 原则 对 最 
佳 实践 进行 取舍 ， 并 快速 达到 组 织 能 力 目标 。 

本 书 适合 大 型 互联 网 公司 的 技术 VP、 技 术 负 责 人 ， 中 小 型 互联 网 公司 的 CTO、 技 术 VP、 研 发 / 
测试 / 运 维 负 责 人 、 主 管 及 骨干 ， 以 及 组 织 变 革 者 阅读 。 
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序 sa 





2007 年 ,我 在 北京 第 一 次 遇 到 乔 梁 , 并 与 之 合作 , 共同 开发 一 款 软件 产品 , 名 为 go.cd， 
这 是 第 一 个 支持 部 署 流水 线 的 CVCD 工 具 。 我 们 在 构建 这 款 产 品 过 程 中 的 思想 碰撞 与 经 验 
总 结 为 《持续 交付 》 一 书 提供 了 非常 关键 的 素材 。 

在 过 去 10 年 中 , 这 些 内 容 已 经 从 最 前 沿 的 想法 变 为 业界 公认 的 智慧 。 每 个 迫 求 齐 越 的 
科技 公司 都 希望 能 够 随时 随地 发 布 ， 而 无 须 工程 师 在 晚上 或 周末 进行 部 署 。 能 够 快速 、 频 
繁 且 安 全 地 发 布 软件 , 并 实现 小 批量 交付 , 意味 着 我 们 可 以 快速 获得 对 我 们 的 想法 的 反馈 。 
我 们 可 以 构建 原型 并 使 用 真实 用 户 对 其 进行 测试 ， 从 而 避免 开发 那些 对 用 户 没有 任何 价值 
的 功能 。 反 过 来 ， 这 也 意味 着 产品 更 好 ， 客 户 更 满意 ， 员 工 更 快乐 。 这 些 能 力 对 需要 这 种 
工作 方式 的 每 个 组 织 来 说 ， 都 是 非常 关键 的 。 

然而 , 获得 这 种 能 力 并 不 是 一 件 容易 的 事情 。 组 织 需要 对 软件 系统 架构 进行 不 断 演进 ， 
使 其 支持 尽快 且 有 效 的 测试 ， 以 及 快速 部 署 ， 同 时， 还 需要 培养 快速 试验 的 文化 。 文 化 因 
素 对 于 成 功 实施 持续 交付 和 通过 持续 交付 实现 产品 管理 实践 至 关 重 要 。 

乔 梁 曾 与 中 国 的 各 类 组 织 合作 ,帮助 它们 实施 持续 交付 并 实现 其 效益 。 我 想 不 出 比 乔 
梁 更 合适 的 人 选 , 来 写 一 本 关于 如 何 根据 实际 经 验 实 现 这 些 想法 的 书 。 希 望 本 书 的 每 位 读 
者 都 能 在 提高 软件 交付 能 力 的 不 断 尝 试 中 取得 圆满 成 功 , 并 利用 这 种 能 力 来 构建 更 好 的 产 
品 和 服务 ， 以 及 更 快乐 、 更 高 效 的 团队 。 























Jez Humble 
《持续 交付 》 一 书 作 者 ，DORA 联 合 创始 人 兼 CTO 











序 2 





我 们 处 在 移动 互联 网 时 代 的 下 半 场 。 这 意味 着 ,对 于 主流 人 群 来 说 ， 头 部 的 基本 需求 
或 许 已 经 被 满足 或 者 说 “饱和 ”， 而 未 来 的 方向 或 许 是 现 有 模式 的 颠 履 ， 或 许 是 长 尾 个 性 
化 需求 的 充分 满足 ， 又 或 许 是 小 众人 群 的 挖掘 。 无 论 如 何 ， 我 相信 未 来 创新 的 成 本 和 创新 
失败 的 可 能 性 有 很 大 的 机 会 持续 走高 。 

在 这 种 大 背景 下 ， 如 何 通过 极致 的 产品 研发 运营 效率 ,快速 发 现 新 的 机 会 ， 降 低 创新 
成 本 就 变 得 尤为 重要 。 乔 梁 老 师 是 软件 工程 领域 的 大 师 ， 同 时 作为 腾讯 的 敏捷 咨询 顾问 ， 
也 和 我 们 合作 多 年 ， 亲历 了 移动 互联 网 发 展 的 全 过 程 ; 乔 梁 老 师 对 产品 研发 运营 体系 的 种 
种 问题 可 谓 调 若 观 火 ， 对 于 效率 的 追求 可 谓 孜 孜 不 倦 。 

“在 快速 变化 的 互联 网 环境 下 ， 软 件 产品 困 队 如 何在 质量 与 速度 上 取得 平衡 ? 如 何 让 
软件 产品 以 最 快 的 速度 抵达 用 户 手中 ， 使 团队 得 到 最 快速 的 反馈 ? ”我 与 乔 深 老师 在 多 年 
前 就 曾 针 对 这 些 问题 有 过 深入 的 探讨 。 “质量 与 速度 根本 不 存在 平衡 ， 只 有 在 产品 能 够 承 
受 的 一 定 质量 水 准 基础 上 ， 追 求 交 付 的 速度 才 有 意义 。 他 的 观点 如 此 鲜明 ， 没 有 咨询 师 
的 “口头 禅 ”一 一 It depends ( 视 情况 而 定 )， 却 道 出 了 产品 整个 生命 周期 中 的 一 个 不 变法 
则 。 虽 然 不 同 的 产品 阶段 对 产品 质量 要 求 有 不 同 的 定义 ， 但 在 同一 产品 阶段 中 ， 质 量 要求 
却 几 乎 是 稳定 的 。 本 书 中 所 讨论 的 内 容 全 部 围绕 “如 何在 满足 质量 要 求 的 前 提 下 快速 交付 
产品 价值 ”这 一 问题 展开 。 

为 了 快速 发 现 新 的 机 会 ， 必 须 加 快 产品 迭代 速度 ， 而 和 从 代 速度 的 加 快 也 会 让 一 些 固定 
成 本 ,例如 为 达到 发 布 质 量 所 需 的 测试 成 本 ,以 及 产品 发 布 流程 所 需 承 担 的 成 本 ， 在 每 个 
迁 代 中 所 占 的 比例 突显 。 这 种 事务 性 成 本 在 很 大 程度 上 阻碍 了 产品 的 迭代 速度 。 乔 梁 老 师 
在 书 中 对 持续 交付 “价值 探索 环 ” 与 “快速 验证 环 ” 中 每 个 步骤 的 详细 拆 解 ， 一 方面 会 让 
你 开阔 对 业务 问题 的 思考 维度 与 角度 ， 另 一 方面 也 能 让 你 发 现 ,在 日 常 工作 中 就 有 很 多 细 
节 可 以 优化 ， 从 而 降低 迭代 中 的 固定 成 本 ， 有 效 提 升 产 品 创新 效率 。 与 此 同时 ， 也 会 在 潜 
移 默 化 中 提高 团队 的 整体 战斗 力 。 

《持续 交付 2.0》 是 乔 梁 老师 在 大 量 实战 项 目 中 总 结 出 来 的 理论 框架 ， 可 谓 经 历 千 锤 百 
炼 。 本 书 也 许 没 有 太 多 高 深 抽象 的 概念 ， 但 每 一 项 原则 和 方法 的 后 面 ， 都 有 足够 多 的 正 反 
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例 支 持 ， 和 乔 老师 的 为 人 一 样 ， 低 调 、 务 实 、 简 单 ， 值 得 每 一 位 钻研 和 应 用 高 效 产 品 研 发 
运营 体系 的 读者 阅读 体会 。 我 相信 ， 在 互联 网 行业 ， 效 率 代表 未 来 。 


曾 宇 


腾讯 副 总 裁 
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2002 年 ， 我 偶然 得 到 一 本 书 ， 名 为 《解析 极限 编程 》。 书 中 介绍 的 软件 开发 方法 与 现 
实 中 使 用 的 工作 方法 截然 不 同 。 书 中 的 很 多 实践 看 上 去 都 不 现实 ， 如 测试 驱动 开发 、 持 续 
集成 、 结 对 编程 、 用 户 故事 等 ， 这 让 我 感到 很 新 奇 ， 怎 么 会 有 团队 这 么 做 呢 ? 但 看 上 去 这 
些 方法 的 确 很 旅人 ， 于 是 我 带 着 “怀疑 ”的 态度 ， 在 实际 工作 中 引入 了 其 中 一 些 方法 , 但 
执行 上 还 是 打 了 一 些 折扣 。 例 如 ， 我 没有 做 测试 驱动 开发 ， 而 只 是 增加 一 些 单元 测试 没 
有 做 结对 编程 ， 而 是 要 求 代码 评审 (code review)， 没有 做 持续 集成 ， 而 是 每 日 构建 。 一 
段 时 间 后 ， 虽 然 能 感受 到 一 些 收 益 ， 但 并 没有 那么 显著 。 

直到 2005 年 , 我 的 一 个 朋友 向 我 展示 了 他 们 如 何 使 用 这 种 开发 方式 交付 真实 的 软件 项 
目 , 和 真实 的 编写 代码 的 过 程 。 每 一 次 修改 代码 , 都 编写 并 执行 一 系列 的 自动 化 测试 用 例 ， 
每 次 提交 都 会 进行 持续 集成 。 这 是 一 种 从 未 有 过 的 编码 体验 ,开发 工程 师 很 少 需要 启动 程 
序 ， 通 过 单 步调 试 来 找 出 代码 中 的 问题 。 这 使 我 真正 相信 ， 的 确 存 在 按照 这 种 敏捷 方式 工 
作 的 团队 ， 而 且 离 我 并 不 遥远 。 

2007 年 ， 我 加 入 ThoughtWorks， 和 希望 能 体验 敏捷 软件 开发 方式 。 作 为 一 名 需求 分 析 师 
和 交付 经 理 ， 我 加 入 了 持续 交付 平台 GoCD 的 产品 研发 ， 我 的 搭档 就 是 Jez Humber (该 产 
品 的 产品 经 理 ) ， 他 也 是 《持续 交付 : 发 布 可 靠 软件 的 系统 方法 》 的 作者 之 一 ， 书 中 很 多 
实践 都 来 自我 们 团队 自己 的 软件 产品 研发 过 程 。 从 想法 的 诞生 到 产品 上 架 ， 我 经 历 了 一 个 
完整 的 产品 研发 过 程 ， 也 真正 认识 了 敏捷 开发 方法 ， 掌 握 了 持续 交付 实践 。 

2009 年 以 后 ， 我 作为 外 部 顾问 或 内 部 教练 ,开始 为 国内 外 很 多 企业 提供 相关 的 组 织 敏 
捷 与 精益 转型 咨询 服务 ， 客 户 既 有 PC 互联 网 时 代 的 巨头 ， 也 有 传统 IT 企业 ， 既 有 国内 知名 
大 企业 , 也 有 高 速成 长 的 移动 互联 网 创业 公司 。 在 与 客户 合作 的 过 程 中 , 我 对 “持续 交付 ” 
有 了 更 深刻 的 理解 ， 也 对 如 何 帮 助 组 织 实现 “持续 交付 价值 ”有 了 全 新 的 认识 。 

2007 年 ， 我 认为 包括 极限 编程 在 内 的 众多 敏捷 开发 实践 是 快速 高 质量 软件 交付 的 法 
宝 ; 2010 年 之 后 , 我 发 现实 践 本 身 虽然 非常 重要 , 但 更 重要 的 是 支撑 实践 的 组 织 管理 方法 、 
工作 思路 与 理念 。 于 是 ,我 的 口头 禅 成 了 “别提 敏捷 ， 只 解决 问题 1"。2012 年 后 ,更 多 的 
软件 开发 方法 与 敏捷 流派 在 国内 开始 盛行 , 但 其 背后 的 核心 理念 与 主要 工作 原则 并 没有 根 
本 性 的 变化 。 无 论 什么 样 的 方法 ， 都 应 该 以 “解决 问题 ”为 出 发 点 ， 而 “解决 问题 ”的 一 
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个 重要 前 提 是 “能 够 正确 定义 问题 ， 并 达成 共识 ”。 

我 当然 不 是 思想 无 用 论 的 支持 者 。 相反, 我 认为 思想 对 每 个 人 对 事物 的 认 知 和 理解 至 
关 重 要 。 但 咨询 经 历 告诉 我 ， 对 事物 的 正确 理解 ， 并 不 能 确保 正确 的 思想 和 理念 在 现实 中 
落地 ， 也 不 能 确保 对 企业 有 大 的 和 直接 的 帮助 。 对 方法 应 用 者 而 言 ， 甚 目标 是 通过 对 思想 
理念 的 认 知 ， 能 够 尽早 解决 自己 (或 者 客户 ) 所 面临 的 杯 手 问题 。 

正如 企业 经 营 管理 一 样 ， 软 件 工程 发 展 的 历程 也 是 各 种 方法 论 不 断 出 现 与 发 展 的 过 
程 。 从 20 世 纪 60 年 代 “ 软 件 工程 ”这 一 术语 的 诞生 ， 到 20 世 纪 70 年 代 提出 课 布 软件 开发 模 
型 ， 以 及 1985 年 提出 的 迭代 增 量 开发 和 1986 年 Barry Boehm 在 “A Spiral Model of Software 
Development and Enhancement” 一 文中 提出 的 喷泉 模型 ，20 世 纪 90 年 代 的 软件 能 力 成 熟 度 
模型 集成 (Capability Maturity Model Integration，CMMI) 的 产生 和 多 种 轻 量 级 软件 开发 方 
法 ，21 世 纪 初 敏捷 宣言 的 正式 发 表 ， 再 到 精益 软件 开发 方法 、 看 板 方法 ， 以 及 持续 交付 和 
DevOps 运 动 。 所 有 这 一 切 变化 ,， 既 反映 出 该 领域 的 快速 变化 , 也 反映 出 没有 哪 一 种 理论 或 
方法 能 够 完全 解决 这 个 领域 面临 的 所 有 问题 。 

本 书 希望 能 够 让 读者 在 了 解 “ 持 续 交 付 ”全 貌 的 基础 上 ， 当 遇 到 与 TT 组 织 效 能 相关 的 
问题 时 ， 能 够 以 适当 的 思考 方式 和 背景 知识 来 应 对 ， 让 你 在 今后 的 工作 中 少 走 一 些 弯 路 ， 
至 少 遇 到 相似 问题 时 ， 可 以 有 所 参考 。 
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从 “软件 工程 ”这 一 名 词 诞生 以 来 ,“ 质 量 ” 和 “效率 ”就 是 它 的 目标 。IT 组 织 大 都 
在 这 条 路 上 探寻 , 从 最 初 的 瀑布 模型 , 到 CMMI, 很 多 组 织 曾经 尊 其 为 软件 开发 过 程 的 “ 圣 
经 ”。 而 当 “ 敏 捷 运动 ”兴起 时 , 他 们 想 要 “做 ”敏捷 ， 当 听 说 “持续 交付 ”, 他 们 想 要 “做 ” 
持续 交付 。 现 在 ，DevOps 也 来 了 ! 在 各 种 各 样 的 交流 大 会 里 ， 不 断 传 来 DevOps 胜 利 的 凯 
歌 ， 各 种 媒体 也 在 报道 它 的 好 处 。 很 多 公司 又 想 要 “DevOps” 了 …… 

我 们 的 确 听 到 过 一 些 美妙 的 “故事 ”， 但 它们 可 能 都 不 属于 我 们 自己 。 在 自己 身边 ， 
就 连 “如 何 让 大 家 对 这 些 理念 或 实践 达成 共识 ”都 成 子 一 大 困难 ， 这 令 你 感到 无 比 困扰 。 
就 像 走 在 一 团 迷雾 之 中 ， 耳 边 一 直 听 到 美妙 的 音乐 响起 也 隐约 看 到 远 处 的 点 点 亮光 ， 然 
而 脚下 的 “路 ” 却 忽 明 忽 暗 。 

多 年 工作 经 历 让 我 对 这 一 领域 有 了 新 的 认识 、 并 进行 总 结 与 反思 。 “持续 交付 ”是 一 
个 非常 有 吸引 力 的 名 字 , 总 会 让 人 浮想 联 遍 , 业务 人 员 似 乎 看 到 了 一 丝 希望 “所 有 的 需求 ， 
上 午 提出 来 ， 下 午 就 能 拿 到 手 ”。 然 而 ， 太 多 的 企业 低估 了 自己 所 面临 的 困难 。 这 些 困难 
一 部 分 是 显 性 的 ， 如 没有 自动 化 测试 ， 也 做 不 到 自动 化 部 署 ， 主 干 开发 更 是 不 可 想象 ， 还 
有 一 部 分 困难 是 隐 性 的 ， 例 如 ， 职 能 部 门 之 间 的 “ 墙 ” 存 在 已 入。 业务 人 员 嫌 开发 团队 的 
软件 交付 速度 慢 ,， 开 发 团队 嫌 业 务 人 员 提 出 的 需求 不 靠 谱 。 这 很 可 能 归 因 于 每 个 人 的 价值 
思考 方式 。 

本 书 的 目标 是 希望 企业 中 所 有 角色 转换 价值 思考 的 角度 , 改进 软件 服务 端 到 端的 商业 
价值 交付 方式 , 提升 相关 人 员 之 间 的 协作 效率 , 最 终 达 到 以 安全 可 靠 的 方式 快速 验证 想法 ， 
缩短 实现 真正 商业 价值 的 时 间 。 也 就 是 说 ， 本 书 不 仅 关注 “从 需求 列表 到 可 运行 的 软件 ” 
这 一 过 程 ， 还 提出 “价值 探索 一 快速 验证 ” 双 闭 环 ， 如 图 0-1 所 示 ， 这 也 是 本 书 的 书 名 “ 持 
续 交 付 2.0” 的 由 来 。 
事实 证 明 , 没有 放 之 四 海 皆 准 的 企业 管理 解决 方案 , 能 够 完美 解决 每 个 企业 遇 到 的 问 
题 。 但是, 管理 者 只 有 从 整体 视角 出 发 , 抵 住 局 部 优化 的 诱惑 ,， 才能 在 资源 有 限 的 情况 下 ， 
引领 企业 创造 更 大 的 价值 。 本 书 提供 了 一 个 整体 框架 ,给 出 了 这 个 框架 中 各 节点 所 涉及 的 
原则 与 相关 的 实践 方法 ， 同 时 介绍 了 它们 的 优势 与 约束 。 

























































































共 创 监测 
图 0-1 ”持续 交付 双 闭 环 模型 





如 果 你 将 “持续 交付 2.0 双 环 模型 ”应 用 到 整个 企业 范围 ， 就 是 一 种 企业 级 的 组 织 管 
理 变 革 指 引 ， 如 果 你 将 它 引 入 某 一 个 团队 ， 对 这 个 团队 来 说 ， 就 是 团队 工作 模式 的 改进 
套路 。 既 然 “持续 交付 2.0” 是 一 个 管理 框架 ， 企 业 势 必要 根据 自己 的 实际 情况 来 进行 定 
制 。 因 此 ， 书 中 列举 了 很 多 实际 案例 ， 告 诉 你 ， 其 他 企业 或 团队 如 何 应 用 这 些 实践 方法 ， 
达到 它们 的 目标 。 这 些 案例 也 说 明 ， 解 决 方案 与 实施 路 径 很 难 在 企业 之 间 进行 复制 ， 企 
业 必须 应 用 书 中 的 原则 ， 结 合 自身 的 实际 情况 (产品 形态 及 所 处 的 商业 竞争 阶段 、 团 队 
的 规模 与 人 员 技能 水 平 、 软 件 系统 架构 ， 以 及 组 织 管理 机 制 与 文化 等 )， 逐 步 探索 出 自己 
的 道路 。 


读者 对 象 


本 书 主 要 服务 于 那些 身 处 IT 业 务 一 线 的 管理 者 , 或 即将 成 为 一 线 管 理 者 的 骨干 技术 人 
员 ， 当 然 也 包括 那些 从 事 软 件 产 品 项 目 管理 和 软件 过 程 改 进 的 人 们 。 对 新 公司 的 创立 者 或 
高 速 发 展 的 成 长 期 公司 技术 高 管 也 有 参考 作用 。 它 并 不 是 为 那些 已 经 成 熟 的 大 型 软件 企业 
的 高 层 管理 者 服务 的 。 当 然 ， 如 果 他 们 也 认为 本 书 有 所 帮助 ， 那 我 也 非常 高 兴 。 

对 于 产品 经 理 、 开 发 经 理 、 测 试 经 理 和 运 维 经 理 ， 可 以 从 本 书 中 获得 更 全 面 的 工作 视 
角 ， 发 现 自 己 领域 之 外 更 多 的 信息 ， 以 及 如 何 与 其 他 角色 协作 共 赢 。 

对 于 过 程 改 进 者 或 者 变革 者 ,可 以 从 本 书 中 了 解 其 他 团队 或 公司 的 做 法 , 希望 能 给 你 
带 来 工作 上 的 灵感 。 

对 于 新 公司 的 创立 者 与 高 速成 长 公司 的 高 管 , 希望 可 以 从 本 书 中 找到 一 些 管理 方式 与 
高 效 方法 ， 使 得 公司 在 成 立 和 发 展 之 初 ， 就 能 够 以 尽 可 能 少 的 成 本 ， 支 持 你 的 事业 持续 高 
速 发 展 。 
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3 前言 








书 中 有 很 多 案例 ， 用 于 帮助 读者 理解 “持续 交付 2.0” 的 双环 模型 ， 与 其 中 各 环 市 应 
用 的 不 同 实践 。 


内 容 简介 


在 进入 正文 之 前 ， 先 谈 谈 本 书 的 结构 和 内 容 。 全 书 共 包括 3 部 分 内 容 。 第 一 部 分 介绍 
了 “持续 交付 2.0” 的 双环 模型 ， 第 二 部 分 主要 讨论 使 用 “持续 交付 2.0” 框 架 中 可 能 遇 到 
的 问题 ， 以 及 改进 过 程 中 需要 遵循 的 原则 。 第 三 部 分 主要 是 案例 分 享 ， 目 的 是 让 读者 体 
会 在 持续 改善 过 程 中 ， 不 同 企业 和 团队 的 实施 重点 与 解决 方案 的 不 同 。 书 中 具体 内 容 如 
下 所 示 。 

第 一 部 分 主要 讲述 “持续 交付 2.0” 双 环 模型 ( 即 持 续 交 付 “8” 字 环 ) 和 “持续 交付 
2.0” 的 4 个 工作 原则 ， 还 会 介绍 两 个 闭环 “价值 探索 ”与 “快速 验证 ”的 执行 步 又 与 相关 








原则 。 
。 第 1 章 讨论 持续 交付 的 发 展 必 然 性 ， 并 介绍 “持续 交付 2.0 双 环 模型 ”及 其 4 个 基本 
原则 。 


。 第 2 章 讨论 “价值 探索 环 ”( 简 称 “探索 环 ”) 的 4 个 核心 环节 ， 以 及 每 个 环 市 的 指 
导 原 则 与 实践 方法 。 只 有 业务 方 能 够 以 “精益 ”方式 思考 ， 持 续 交 付 才能 更 显 威 
力 ， 否 则 很 可 能 退缩 成 为 持续 交付 1.0 的 单 环 模式 即 只 有 “快速 验证 环 ”。 

。 第 3 章 简单 阐述 “快速 验证 环 ”( 简 称 “ 验 证 环 ”") 中 各 坏 节 的 主要 活动 ， 并 给 出 各 

环节 的 工作 方法 。 
第 二 部 分 主要 阐述 “持续 交付 2.0” 的 实施 七 巧 板 中 ， 三 大 主要 板块 的 工作 原则 与 实 
践 方法 。 这 三 大 板块 包括 组 织 机 制 、 软 件 架 构 与 基础 设施 。 甚 中 组 织 机 制 是 一 个 复杂 课题 ， 
本 书 仅 讨论 持续 交付 所 需 的 文化 ， 以 及 建立 文化 的 四 步 法 。 组 织 架 构 、 人 才 结 构 、 激 励 机 
制 等 内 容 将 在 本 书 的 续篇 中 专题 讨论 。 基 础 设施 部 分 是 产品 研发 过 程 中 最 基础 的 工作 。 这 
部 分 首先 讨论 持续 交付 部 署 流 水 线 及 其 工具 设计 原则 , 然后 分 别 介绍 部 署 流 水 线 的 建立 与 
优化 必须 关注 的 五 大 领域 ,也 就 是 说 ， 业 务 需 求 协作 流程 、 分 支 与 配置 管理 、 构 建 与 环境 
管理 、 自 动 化 测试 管理 ， 以 及 部 署 发 布 与 监控 管理 。 
。 第 4 章 讨论 持续 交付 能 力 的 提升 需要 企业 具有 信任 、 安 全 和 持续 改善 的 组 织 文化 ， 
并 介绍 丰田 公司 和 谷歌 公司 用 过 的 改善 组 织 文化 四 步 法 。 

。 第 5 章 讨论 软件 架构 对 实现 持续 交付 快速 验证 能 力 的 重要 性 、 有 利于 持续 交付 的 软 
件 架构 特征 ， 以 及 软件 架构 改造 的 3 种 方式 ， 即 “拆迁 ”“ 绞 杀 ” 和 “修缮 ”。 

。 第 6 章 讨论 如 何 利 用 约束 理论 和 精益 思想 ， 发 现 流程 中 的 瓶颈 ,使 各 角色 之 间 的 业 
务 需 求 协作 更 加 顺畅 ， 提 升 需 求 流动 速度 。 

。 第 7 章 讨 论 快速 验证 环 所 依赖 的 部 署 流水 线 的 设计 原则 与 工具 链 建设 草案 。 














第 8 章 讨论 代码 仓库 的 分 支 方式 对 持续 交付 的 重大 影响 , 以 及 不 同 分 支 方 式 下 部 署 
流水 线 的 建设 方案 。 最 后 介绍 代码 分 支 的 数量 对 发 布 策略 的 影响 。 

第 9 章 回顾 持续 集成 的 历史 ， 并 讲解 如 何 判断 团队 是 否 在 实践 “持续 集成 "， 还 给 
出 企业 实施 持续 集成 的 五 大 步骤 。 
第 10 章 讨论 软件 发 布 以 前 制订 自动 化 测试 策略 需要 考虑 的 因素 ， 还 介绍 持续 集成 
对 自动 化 测试 用 例 的 编写 与 运行 要 求 。 最 后 ， 为 了 提高 自动 化 测试 的 投资 回报 率 ， 
团队 如 何 为 遗留 系统 编写 和 增加 自动 化 测试 用 例 。 

第 11 章 讨论 软件 配置 管理 , 它 是 持续 交付 快速 验证 环 的 基础 。 对 代码 、 配 置 、 环 境 、 
数据 做 好 配置 管理 ， 最 终 实 现 一 键 部 署 和 一 键 测 试 ， 让 各 角色 在 协作 过 程 中 能 够 
全 部 实现 自动 化 服务 ， 并 且 互 不 影响 ， 解 放 人 的 大 脑 和 双手 ， 做 更 有 价值 的 事情 ， 
而 让 机 器 做 它 擅长 的 事 一 一 不 断 地 重复 。 

第 12 章 讨论 降低 生产 部 署 与 发 布 风险 的 技术 与 方法 。 

第 13 章 讨论 软件 在 运行 时 ， 数 据 收 集 与 分 析 的 重要 性 ， 以 及 衡量 数据 监测 环节 的 
衡量 指标 ， 包 括 正 确 性 、 完 整 性 和 及 时 性 ， 此 外 ， 还 介绍 测试 扁平 化 趋势 ， 以 及 
生产 环境 上 的 质量 巡 检 与 演习 。 
































第 三 部 分 主要 是 实战 案例 的 分 析 。 它 们 分 别 代表 不 同类 型 的 公司 、 不 同 大 小 的 团队 以 
及 不 同 的 软件 产品 特点 。 我 将 带 你 深入 案例 现场 ， 了 解 当时 状况 ， 分 析 问 题 ， 并 提出 解决 


思路 。 








第 14 章 介绍 一 个 百人 工程 师 的 互联 网 产品 团队 历经 一 年 时 间 ， 如 何 打造 快速 运转 
的 “持续 交付 2.0 双 环 模型 ， 并 且 做 到 可 持续 运转 。 

第 15 章 介绍 在 无 法 “测试 右 移 ”的 情况 下 ， 一 个 大 项 目 中 的 小 团队 如 何 改变 团队 
协作 模式 ， 从 “死亡 行军 ”转变 为 “无 缺陷 交付 ”。 

第 16 章 介绍 一 个 微服 务 化 开发 团队 如 何在 项 目 运行 的 过 程 中 ， 通 过 逐步 对 基础 设 
施 板 块 中 各 模块 进行 改造 ， 提 升 交付 质量 与 频率 ， 并 推动 运 维 人 员 也 做 出 改变 ， 
真正 成 为 一 个 “DevOps 团 队 ”。 














阅读 方法 


如 何 阅 读本 书 取决 于 读者 的 目标 是 什么 。 你 可 以 按照 章节 从 头 到 尾 读 下 来 。 这 样 ， 





你 可 以 了 解 我 在 工作 中 应 用 到 的 知识 体系 ， 最 终了 解 为 什么 “持续 交付 2.0 是 一 种 组 织 


会 已 ?7 
HE » 


的 问题 。 


如 何 衡量 这 种 组 织 能 力 ， 以 及 如 何在 具体 的 工作 场景 中 运用 相关 原则 解决 具体 





当然 ， 读 者 也 可 以 根据 自己 的 兴趣 以 及 工作 中 遇 到 的 问题 ， 选 取 不 同 的 章节 。 例 如 ， 
后 面 3 章 的 具体 案例 分 析 包 括 小 团队 的 改进 案例 、 大 团队 的 变革 案例 ， 其 至 超大 公司 所 用 
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5 朋 局 





人 


的 一 些 工作 方法 与 工具 。 这 样 ,读者 也 许可 以 为 明天 将 要 进行 的 艰难 说 服 工作 找到 一 丝 破 








你 喜欢 什 


局 的 思路 。 
无 论 怎 样 ， 我 都 非常 重视 你 的 反馈 。 让 我 知道 你 对 这 本 书 有 什么 想法 
么 ?你 还 希望 知道 哪些 内 容 ? 你 可 以 扫描 下 面 的 二 维 码 , 关注 “持续 交付 2.0” 的 微 信 公众 


号 , 或 者 访问 www.continuousdelivery20.com 网 站 查看 相关 的 延伸 阅读 内 容 。 
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本 书 由 异步 社区 出 品 , 社区 (https://www.epubit.com/) 为 您 提供 相关 资源 和 后 续 服务 。 
提交 勘误 

作者 和 编辑 尽 最 大 努力 来 确保 书 中 内 容 的 准确 性 ,但 难免 会 存在 琉 漏 。 欢 迎 您 将 发 现 
的 问题 反馈 给 我 们 ， 帮 助 我 们 提升 图 书 的 质量 。 

当 您 发 现 错误 时 ， 请 登录 异步 社区 ， 按 书 名 搜索 ， 进 入 本 书页 面 ， 点击 “提交 勘误 ”， 
输入 勘误 信息 ， 点 击 “ 提 交 ” 按 钮 即 可 。 本 书 的 作者 和 编辑 会 对 您 提交 的 勘误 进行 审核 ， 
确认 并 接受 后 ， 您 将 获 赠 异步 社区 的 100 积 分 。 积分 可 用 二 在 异步 社区 兑换 优惠 券 、 样 书 


或 奖品 。 
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与 我 们 联系 


我 们 的 联系 邮箱 是 contact@epubit.com.cn。 

如 果 您 对 本 书 有 任何 疑问 或 建议 , 请 您 发 邮件 给 我 们 ，, 并 请 在 邮件 标题 中 注 明 本 书 书 
名 ， 以 便 我 们 更 高 效 地 做 出 反馈 。 

如 果 您 有 兴趣 出 版 图 书 、 录 制 教学 视频 ， 或 者 参与 图 书 翻译 、 技 术 审 校 等 工作 ， 可 以 
发 邮件 给 我 们 ， 有 意 出 版 图 书 的 作者 也 可 以 到 异步 社区 在 线 提 交 投 稿 (直接 访问 
www.epubit.com/selfpublish/submission 即 可 ) 。 

如 果 您 是 学 校 、 培 训 机 构 或 企业 ， 想 批量 购买 本 书 或 异步 社区 出 版 的 其 他 图 书 ， 也 可 
以 发 邮件 给 我 们 。 

如 果 您 在 网 上 发 现 有 针对 异步 社区 出 品 图 书 的 各 种 形式 的 盗版 行为 , 包括 对 图 书 全 部 
或 部 分 内 容 的 非 授 权 传播 ， 请 您 将 怀疑 有 侵权 行为 的 链接 发 邮件 给 我 们 。 您 的 这 一 举动 是 
对 作者 权益 的 保护 ， 也 是 我 们 持续 为 您 提供 有 价值 内 容 的 动力 之 源 。 


关于 异步 社区 和 异步 图 书 


“异步 社区 ”是 人 民 邮 电 出 版 社 旗下 IT 专 业 图 书社 区 ， 致 力 于 出 版 精品 I 技术 图 书 和 
相关 学 习 产 品 , 为 作 译 者 提供 优质 出 版 服务 。 异 步 社区 创办 于 2015 年 8 月 , 提供 大 量 精品 IT 
技术 图 书 和 电子 书 ， 以 及 高 品质 技术 文章 和 视频 课程 。 更 多 详情 请 访问 异步 社区 官网 
https:/www.epubit.com 。 

“异步 图 书 ” 是 由 异步 社区 编辑 团队 策划 出 版 的 精品 开 专 业 图 书 的 品牌 依托 于 人 民 
邮电 出 版 社 近 30 年 的 计算 机 图 书 出 版 积累 和 专业 编辑 团队 ,相关 图 书 在 封面 上 印 有 异步 图 
书 的 LOGO。 异 步 图 书 的 出 版 领域 包括 软件 开发 、 大 数据 、AI、 测 试 、 前 端 、 网 络 技术 等 。 
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pa nl 《持续 交付 》 已 出 版 8 年 ， 一直 受到 软件 行业 从 业者 的 关注 。 书 中 的 软 

一 工件 开发 原则 和 实践 也 随 着 商业 环境 VUCA 特 性 的 明显 增强 而 逐渐 受到 软件 技 
术 人 员 的 认可 。 

VUCA 是 volatility ( 易 变 性 )、uncertainty (不 确定 性 )、complexity (复杂 性 ) 和 ambiguity 
(模糊 性 ) 的 首 字 母 缩 写 。 VUCA 这 个 术语 源 于 军事 用 语 , 在 20 世 纪 90 年 代 开始 被 普遍 使 用 ， 
用 来 描述 冷战 结束 后 的 越发 不 稳定 的 、 不 确定 的 、 复 杂 、 模 棱 两 可 和 多 边 的 世界 。 在 2001 
年 9 月 11 日 您 怖 柳 击 发 生 之 后 , 这 一 概念 和 首 字 母 缩 写 才 真正 被 确定 。 随后，VUCA 被 战略 
性 商业 领袖 们 用 来 描述 已 成 为 “新 常态 ”的 、 混 乱 的 和 快速 变化 的 商业 环境 。 

然而 , 在 应 用 这 些 为 达成 持续 交付 目标 所 需 的 软件 技术 相关 原则 与 实践 时 ,我们 会 遇 
到 很 多 难题 。 例 如 ， 业 务 压 力 太 大 ， 没 有 时 间 改 进 ; 开发 和 测试 的 时 间 被 压缩 得 太 少 了 ， 
没有 时 间 这 么 干 ;， 这 么 做 的 风险 太 高 了 ， 质 量 很 难保 障 。 而 这 些 难题 正 是 由 于 软件 工程 的 
发 展 惯性 带 来 的 ， 是 到 了 改变 的 时 候 了 。 


1.1 软件 工程 发 展 概述 


“软件 工程 ”这 一 学 科 出 现 于 1968 年 ， 当 时 正 值 第 一 次 软件 危机 。 第 一 次 软件 危机 是 
落后 的 软件 生产 方式 无 法 满足 迅速 增长 的 计算 机 软件 需求 ， 从 而 导致 软件 开发 与 维护 过 程 
中 出 现 一 系列 严重 问题 的 现象 。 人 们 试图 借鉴 建筑 工程 领域 的 工程 方法 来 解决 这 一 问题 ， 
以 实现 “ 按 预 算 准 时 交付 所 需 功 能 的 软件 项 目 ” 的 愿望 。 


1.1.1 瀑布 软件 开发 方法 


瀑布 软件 开发 模型 由 Dr Winston W. Rovce 在 1970 年 发 表 的 “Managing the development 
of large software systems” 一 文中 首次 提出 ， 如 图 1-1 所 示 。 它 将 软件 开发 过 程 定义 为 多 个 
阶段 ， 每 个 阶段 均 有 严格 的 输入 和 输出 标准 ， 项 目 管理 者 希望 通过 这 种 重 计划 、 重 流程 、 
重文 档 的 方式 来 解决 软件 危机 。 很 多 人 将 具有 以 上 3 个 特征 的 软件 开发 方法 统称 为 “重型 
软件 开发 方法 ”。 
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1-1 瀑布 软件 开发 模型 


在 20 世 纪 , 瀑布 软件 开发 模型 的 每 个 阶段 都 需要 花费 数 月 的 时 间 。 在 写 出 第 一 行 产 品 
代码 之 前 ， 甲 乙 双 方 需要 花费 大 量 精力 确定 需求 范围 ， 审 核 比 《 新 华 字典 》 厚 得 多 的 软件 
需求 规格 说 明 书 。 即 便 如 此 ， 双 方 还 是 要 为 “是 否 发 生子 需求 范围 的 变更 ” “是否 准时 交 
付 了 软件 ”“ 交 付 的 软件 是 否 满 足 了 预先 设 定 的 业务 需求 ”而 纠 绰 不 清 。 


1.1.2 敏捷 软件 开发 方法 


从 20 世 纪 80 年 代 开始 ， 微 型 计算 机 开始 快速 普及 。20 世 纪 90 年 代 ， 人 们 对 软件 的 需求 
迅速 扩大 。 然 而 ，Standish Group 的 Chaos Report 1994 显 示 ， 软 件 交付 项 目的 失败 或 交付 困 
难 的 比率 仍旧 很 高 (成 功率 只 有 16.2%， 受 到 挑战 的 项 目 占 比 52.7%， 而 失败 率 为 31.1% ) 。 
此 时 ， 很 多 优秀 的 软件 工作 者 不 满意 瀑布 软件 开发 方法 的 交付 成 果 ， 并 在 各 自 工作 实践 中 
总 结 了 各 种 新 的 软件 开发 方法 ， 例 如 我 们 现在 经 常 听 说 的 Serum 和 极限 编程 ， 都 是 在 那个 
时 代 涌 现 出 来 的 软件 开发 方法 。 

2001 年 ，17 位 软件 大 师 齐 聚 加 拿 大 的 一 个 小 镇 一 雪 岛 (Snowbird) ， 总 结 了 当时 涌 
现 的 这 些 轻 量 级 软件 开发 方法 所 具备 的 特点 ， 共 同 发 表 了 “敏捷 宣言 "， 提 出 敏捷 软件 开 
发 方法 应 该 遵循 的 十 二 原则 ， 见 附录 A。 与 会 人 员 一 致 同意 ， 凡 符合 这 一 宣言 所 倡导 的 价 
值 观 且 遵 循 十 二 开发 原则 的 方法 均 可 被 认为 是 “敏捷 软件 开发 方法 "。 因 此 ,“ 敏 捷 软件 开 
发 方法 ”这 一 说 法 从 其 诞生 开始 就 是 一 秘 软 件 开发 方法 的 代名词 ， 而 不 是 特 指 某 一 种 软件 
并 发 方法 ; 

敏捷 软件 开发 方法 强调 发 挥 人 的 主观 能 动 性 ， 提 倡 面对面 沟通 、 拥 抱 变化 、 通 过 迁 代 
和 增 量 开发 尽早 交付 有 价值 的 软件 。 此 时 ， 很 多 团队 已 认识 到 ,软件 开发 实际 上 是 一 个 不 
断 迭 代 学 习 的 过 程 ， 即 软件 工程 师 需要 快速 学 习 并 理解 领域 知识 ， 并 将 其 转化 成 数字 世界 
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的 表达 形式 ， 通 过 与 业务 专家 的 交流 讨论 来 学 习 并 持续 迭代 这 个 过 程 。 一 个 软件 交付 计划 
被 划分 成 多 个 迭代 ， 强 调 在 每 个 迭代 结束 时 应 该 得 到 可 运行 的 软件 ， 如 图 1-2 所 示 。 


ni i 














敏捷 开发 ! 


图 1-2 ”和 迭代 开发 ， 多 批 次 部 署 发 布 


与 瀑布 软件 开发 方法 只 在 项 目 交 付 后 期 才能 看 到 可 运行 的 软件 相 比 , 敏捷 软件 开发 方 
法 在 这 方面 有 很 大 的 进步 。“ 持 续集 成 ”作为 敏捷 开发 方法 中 的 一 个 工程 实践 ， 率 先 被 更 
广泛 的 IT 组 织 所 接受 ,即便 那 些 没 有 采纳 敏捷 开发 方法 的 团队 也 会 使 用 它 ， 因 为 其 强调 的 
频繁 自动 化 构建 和 自动 化 测试 减少 了 质量 保障 团队 的 重复 工作 量 , 也 排除 了 开发 团队 与 质 
量 保障 团队 之 间 的 沟通 障碍 。 

当时 的 主流 软件 需求 仍旧 是 来 自 企业 级 定制 软件 开发 。 虽 然 敏 捷 开 发 方法 使 用 的 是 迭 
代 模 型 ， 但 两 次 软件 发 布 之 间 的 间隔 时 间 仍 旧 较 长 〈 通 常 是 数 月 ， 其 至 一 年 以 上 ) 。 因 此 ， 
业务 人 员 与 研发 团队 之 间 关于 需求 变更 和 研发 效率 的 矛盾 仍旧 是 主要 了 矛盾。 系统 的 部 署 发 
布 工 作 在 整个 发 布 周 期 中 所 占用 的 时 间 和 成 本 相对 较 小 ， 部 署 和 运 维 工作 还 不 是 突出 矛 
盾 。 另 外 ， 部 署 活 动 通常 由 专门 的 技术 运 维 团 队 执 行 ， 产 品 研发 团队 对 其 无 感 。 

在 这 一 时 期 , 无 论 瀑布 开发 还 是 敏捷 开发 ,在 软件 行业 中 最 重要 的 关注 点 都 是 可 交付 
的 软件 包 本 身 ， 即 如 何 快速 地 将 软件 需求 变 为 可 交付 的 软件 包 。 


1.1.3” DevOps 运 动 


DevOps 的 萌芽 源 于 2008 年 8 月 敏捷 大 会 多 伦 多 站 的 一 个 临时 话题 “敏捷 基础 设施 
(Agile Infrastructure)”。 当 时 比利时 独立 IT 咨询 师 Patrick Debois 韭 常 感 兴 趣 , 并且 分 享 了 关 
于 “将 敏捷 实践 应 用 于 运 维 领域 "。2009 年 10 月 ，Patrick 在 比利时 的 根 特 组 织 了 一 个 
“DevOpsDays” 社 区 会 议 ， 并 正式 启用 了 “DevOps” 这 个 术语 。 

2010 年 “The Agile Admin” 网 站 上 发 表 的 一 篇 题 为 “Whatis DevOps”( 什 么 是 DevOps) 
的 文章 中 指出 :“DevOps 是 一 组 概念 集合 的 代称 ， 虽 然 并 非 全 部 都 是 新 概念 ， 但 它们 已 经 
催化 为 一 种 运动 ， 并 迅速 在 整个 技术 社区 中 传播 。” 同时， 该 文章 也 给 出 了 其 原始 定义 ， 
即 “DevOps 是 运 维 工 程 师 和 开发 工程 师 参 与 整个 服务 生命 周期 (从 设计 到 开发 再 到 生产 支 
持 ) 的 一 组 实践 ”"， 并 提出 ，DevOps 应 该 倡导 运 维 人 员 更 多 地 使 用 和 开发 人 员 使 用 的 相同 
技术 来 进行 系统 运 维 工作 。 

DevOps 在 维基 百科 上 的 定义 也 在 随 着 时 间 的 推进 而 不 断 变化 着 。 截 止 到 2017 年 ， 其 
定义 为 : 
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DevOps 是 一 种 软件 工程 文化 和 实践 ， 旨 在 统一 整合 软件 开发 和 软件 运 维 。 
DevOps 运 动 的 主要 特点 是 强烈 倡导 对 构建 软件 的 所 有 环节 (从 集成 、 测 试 、 发 布 
到 部 署 和 基础 架构 管理 ) 进行 全 面 的 自动 化 和 监控 。DevOps 的 目标 是 缩短 开发 周 
期 ， 提 高 部 署 频率 和 更 可 靠 地 发 布 ， 与 业务 目标 保持 一 致 。 


事实 上 ， 到 写作 本 书 之 时 ， 业 界 对 DevOps 并 没有 统一 的 标准 定义 。 正 如 “敏捷 ”一 
样 ， 每 一 位 从 业者 、 每 一 个 企业 都 有 自己 所 理解 的 DevOps。 有 些 人 认为 DevOps 是 敏捷 的 
一 个 子 集 ， 有 些 人 认为 “敏捷 做 对 了 ， 就 是 DevOps”， 还 有 人 则 将 DevOps 看 作 围绕 自动 化 
实施 的 一 套 实 践 ， 或 多 或 少 与 敏捷 有 些 关 联 性 。 

从 历史 时 间 点 上 来 看 ，DevOps 源 于 敏捷 思想 和 实践 在 运 维 领域 的 应 用 ， 但 当时 的 实 
操 指 导 性 不 足 ， 而 近 平 同 期 出 版 的 《持续 交付 》 一 书 使 其 更 加 具象 化 ， 在 企业 实践 方面 更 
具有 可 操作 性 。 书 中 给 出 了 一 系列 的 原则 、 方法 与 实践 , 使 DevOps 运 动 的 参与 者 有 线索 可 
循 ， 例 如 持续 交付 中 强烈 倡导 的 “一 切 丝 代码 ， 自 动 化 一 切 ， 部 署 流水 线 尽早 反馈 ”等 。 

DevOps 并 非 一 个 标准 、 一 种 模式 或 者 一 套 固定 方法 ,而 是 一 种 IT 组 织 管理 的 发 展 趋势 ， 
也 就 是 说 ， 通 过 多 种 方式 打破 IT 职能 部 门 之 间 的 隔 国 ， 改 变 IT 组 织 内 部 的 原 有 合作 模式 ， 
使 之 更 紧密 结合 ， 从 而 促进 业务 迭代 速度 更 快 。 这 种 发 展 趋势 将 会 引起 IT 组 织 内 部 原 有 和 角 
色 与 分 工 的 变化 ， 其 至 范围 更 大 , 会 影响 到 相关 的 业务 组 织 。 对 互联 网 公司 来 说 ， 其 软件 
产品 对 业务 发 展 起 到 极其 关键 的 作用 ， 业 务 结果 与 开 效 能 强 关 联 ， 因 此 顺应 这 一 发 展 趋势 
的 动力 更 加 明显 和 迫切 。 

既然 DevOps 是 一 种 组 织 管理 的 发 展 趋势 ， 那 么 它 就 是 IT 领域 普 适 的 。 对 于 不 同行 业 、 
不 同 企业 中 的 IT 组 织 ， 需 要 根据 其 所 在 行业 的 行业 特点 以 及 企业 实际 状况 进行 一 系列 的 管 
理 定 制 。 


1.1.4 ”持续 交付 1.0 


2006 年 ，Jez Humble、Chris Read 和 Dan North 共 同 发 表 了 一 篇 题 为 “The Deployment 
Production Line” (部署 生产 线 ) 的 文章 。 文 中 讨论 了 软件 部 署 带 来 的 生产 效率 问题 ， 并 首 
次 提出 “部 署 生产 线 ”模式 : 


测试 和 部 署 是 软件 开发 过 程 中 最 困难 且 耗 时 的 阶段 。 即 使 团队 已 经 使 用 
自动 构建 完成 了 代码 的 测试 工作 ， 也 需要 几 天 时 间 做 生产 部 署 的 情况 仍旧 很 常 
见 …… 我 们 描述 的 原则 和 实践 使 你 可 以 一 键 创建 、 配 置 和 部 署 新 的 环境 。 

a 通过 多 阶段 自动 化 工作 流程 ,测试 和 部 署 过 程 可 以 完全 自动 化 。 利 用 这 
种 “部 署 生产 线 ”， 可 以 将 已 经 过 验证 的 代码 快速 部 署 到 生产 环境 中 ， 并 且 一 旦 
发 生 问 题 ， 就 可 以 轻松 地 回 退 到 以 前 的 版 本 。 
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该 文章 的 3 位 作者 当年 均 就 职 于 ThoughtWorks 公 司 ， 而 该 公司 是 敏捷 软件 开发 方法 的 
践 行者 、 倡 导 者 和 推广 者 。 该 公司 使 用 的 软件 开发 方法 也 源 自 极限 编程 方法 。 作 者 通过 各 
自 的 实践 总 结 出 了 “部 署 流 水 线 ” 模 式 的 雏形 ， 并 且 对 如 何 使 自动 化 部 署 活动 更 轻松 给 出 
了 以 下 4 条 指导 原则 。 

(1) 每 个 构建 阶段 都 应 该 交付 可 工作 的 软件 ， 即 对 于 中 间 产 物 的 生成 〈 例 如 搭建 软件 
框架 ) 不 应 该 是 一 个 单独 的 阶段 。 

(2) 用 同一 个 制品 (artifacts) 向 不 同类 型 的 环境 部 署 ， 即 将 其 与 运行 时 配置 分 开 
管理 。 

(3) 自动 化 测试 和 部 署 ， 即 根据 测试 目的 ,分 成 几 个 独立 的 质量 关卡 。 

(4) 这 个 部 署 生产 线 设 计 也 应 该 随 着 你 的 应 用 程序 的 发 展 而 不 断 演进 。 

2007 年 ，ThoughtWorks 公 司 的 Dave Farley 也 发 表 了 一 篇 题 为 “The Deployment Pipeline 
- Extending the range of Continuous Integration”( 部 署 流 水 线 一 一 持续 集成 的 延伸 ) 的 文章 。 
文中 指出 , 部 署 流 水 线 就 是 通过 自动 化 方式 将 多 个 质量 验证 关卡 及 其 中 的 验证 内 容 联 系 在 
一 起 ， 如 图 1-3 所 示 。 


提交 测试 关卡 
清理 环境 
编译 

单元 测试 











验收 测试 关卡 性 能 测试 关卡 生产 环境 部 署 











组 装 打包 
保存 软件 包 


部 署 软件 包 
运行 验收 测试 运行 部 分 验收 测试 运行 冒 烟 测 试 
准备 性 能 测试 数据 
运行 性 能 测试 
图 1-3 ”Dave Farley 在 2007 年 定义 的 部 署 流水 线 


同年 12 月 ，ThoughtWorks 在 北京 正式 组 建 了 产品 研发 团队 ， 启 动 了 以 这 种 部 署 流 水 
线 为 指导 思想 的 软件 持续 发 布 管理 工具 的 研发 。 当 时 Jez Humble 是 产品 经 理 , 我 负责 该 产 
品 的 交付 与 业务 分 析 。 该 产品 的 第 一 个 版 本 发 布 于 2008 年 7 月 ， 取 名 为 Cruise ( 现 名 为 
GoCD)。 其 最 重要 的 一 个 功能 特性 就 是 “部 署 流 水 线 ”(deployment pipeline)。 而 且 很 多 
特性 设计 (包括 内 置 的 制品 仓库 、 多 阶段 之 间 的 制品 引用 ) 也 体现 了 “一 次 构建 ， 多 次 
使 用 ”的 原则 。 

在 开发 GoCD 期 间 , Jez Humble 和 Dave Farley 合 著 了 《持续 交付 》(Continuous Delivery) 
一 书 ， 英 文 版 于 2010 年 正式 出 版 ， 该 书 于 2011 年 获得 Jolt 杰 出 大 奖 ， 中 文 版 也 于 2011 年 在 
国内 上 市 ， 这 标志 着 “持续 交付 ”这 一 术语 的 正式 诞生 。Jez Humble 说 :“ 持 续 交 付 是 一 种 
能 力 ， 也 就 是 说 ， 能 够 以 可 持续 方式 ， 安 全 快速 地 把 代码 变更 (包括 特性 、 配 置 、 缺 陷 和 
试验 ) 部 署 到 生产 环境 上 ， 让 用 户 使 用 。” 本 书 将 这 一 定义 称 为 “持续 交付 1.0”。 

在 《持续 交付 》 一 书 中 ， 讲 述 了 持续 交付 1.0 所 遵循 的 理念 、 原 则 和 众多 方法 与 实践 ， 
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并 在 该 书 最 后 一 章 指出 :“ 它 不 仅仅 是 一 种 新 的 软件 交付 方法 论 ， 而 且 对 依赖 软件 的 业务 
来 说 ， 是 一 个 全 新 的 范式 。 

持续 交付 1.0 提 供 的 很 多 原则 及 方法 是 DevOps 运 动 的 具体 实 操 指引 ， 它 们 可 以 为 企业 
的 IT 困 队 将 DevOps 运 动 落 地 实施 提供 非常 具体 的 指导 ， 如 图 1-4 所 示 。 


2010 年 上 ED ED ED ED EY EY ED EY ED EPE 


0 


图 1-4 “持续 交付 将 发 布 权 交 还 给 业务 广 


从 所 涉及 的 协作 角色 来 看 ， 敏 捷 开 发 更 多 地 涉及 产品 需求 方 、 软 件 开发 工程 师 和 软 
件 测试 工程 师 。 在 历史 上 ，DevOps 更 多 地 涉及 软件 研发 团队 (包括 开发 工程 师 和 测试 工 
程 师 ) 与 运 维 工程 师 ， 而 持续 交付 1.0 涉 及 产品 需求 方 、 软 件 研 发 团队 和 运 维 工程 师 ， 如 


1-5 所 示 o 
持续 交付 1.0 
| EE DevOps 
敏捷 




















产品 开发 测试 
图 1-5 ”相关 概念 在 组 织 角色 的 主要 触 达 点 


[ey 
襄 


























持续 部 署 与 持续 交付 


很 多 人 认为 ， 持 续 部 署 (continuous deployment ) 是 持续 交付 (continuous delivery ) 
的 进 阶 状态 ， 是 指 代 码 提 交 后 一 旦 成 功 通过 所 有 质量 验证 ， 就 立即 自动 部 署 到 生产 环境 
中 ， 不 需要 任何 人 的 审批 。 事 实 上 , “部 署 ” 与 “交付 ”这 两 个 主干 词 的 意义 并 不 相同 。 

“部 署 ” 是 一 种 技术 领域 的 操作 ， 也 就 是 说 ， 从 某 处 获取 软件 包 ， 并 按照 预先 设计 
的 方案 将 其 安装 到 计算 节点 上 ， 并 确保 系统 可 以 正常 启动 ， 但 它 并 不 一 定 意味 着 “必须 
包含 业务 功能 的 发 布 或 交付 ”。“ 交 付 ” 则 是 一 个 业务 决策 活动 ， 通 常 也 被 称 为 “发 布 ”， 
也 就 是 说 ,如果 将 新 构建 的 特性 交付 到 客户 (用户 ) 手中 ,用户 就 可 以 看 到 并 使 用 它们 。 
































Q@ 范式 (paradigm) 就 是 指 在 某 一 学 科 或 领域 内 的 一 种 哲学 理论 框架 ， 它 由 理念 (或 思考 模式 ) 及 其 指导 下 的 
一 系列 研究 方法 与 标准 组 成 。 简 而 言 之 ,“ 范 式 = 理 念 + 方法 ”。 
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之 所 以 “部 署 ” 与 “发 布 ” 几 乎 成 为 等 价 词 ， 是 历史 原因 造成 的 。 很 久 以 前 ， 软 件 
的 发 布 周期 较 长 ， 每 次 新 功能 部 署 之 后 就 会 立即 发 布 。 久 而 久之 ，“ 部 署 ” 就 成 了 “发 
布 ” 的 代名词 。 为 了 保证 软件 质量 ，IT 部 门 通常 不 允许 无 关 代 码 ( 即 与 本 次 发 布 新 特性 
集合 无 关 ， 例 如 未 开发 完成 的 功能 、 不 完善 的 功能 集 ) 被 带 到 生产 环境 中 。 因此， 每 次 
部 署 就 一 定 是 重大 功能 的 发 布 。 

随 着 互联 网 软件 的 出 现 , “部 署 ” 和“ 发布 ” 内容 与 频率 不 同 的 情况 也 是 很 常见 的 。 
我 们 可 以 向 环境 多 次 部 署 ,但 只 有 当 业 务 需 要 时 才 向 用 户 发 布 ， 如 图 1-4 中 的 箭头 所 示 。 
例如 ，Facebook 公 司 的 发 布 工 程 师 Chuck Rossi 在 2011 年 该 公司 举办 的 技术 分 享 会 上 指 
出 : “我 们 现在 每 天 会 对 Facebook 网 站 进行 一 次 部 署 操作 …… Facebook 公 司 在 半年 后 将 
要 主推 的 功能 特性 ， 现 在 已 经 上 线 了 ， 只 是 用 户 看 不 到 而 已 。” 


1.2 ”持续 交付 2.0 


持续 交付 1.0 关 注 于 “从 提交 代码 到 产品 发 布 ”的 过 程 ， 如 图 1-6 所 示 ， 并 且 提供 了 一 
系列 工作 原则 和 优秀 的 实践 方法 ， 可 以 提升 软件 开发 活动 的 效率 。 











图 1-6 ”持续 交付 1.0 的 关注 点 





但 是 , 我 在 实际 咨询 过 程 中 发 现 , 一 些 软 件 功 能 在 开发 完成 之 后 ， 对 用 户 或 者 业务 来 
说 ,并 没有 产生 什么 影响 ， 有 些 功 能 根本 没有 用 户 来 使 用 。 可 是 ， 这 些 功 能 的 确 花费 了 团 
队 的 很 多 精力 才 设 计 实 现 。 这 是 一 种 巨大 的 浪费 。 这 种 “无 用 ”的 功能 生产 得 越 多 ,浪费 
就 越 大 。 我 们 是 否 可 以 找到 一 些 方法 ， 让 我 们 付出 的 努力 对 业务 改善 更 加 有 效 ， 或 者 只 用 
很 少 的 成 本 就 可 以 验证 对 业务 无 效 呢 ? 
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1.2.1 精益 思想 


2011 年 出 版 的 《精益 创业 》 一 书 给 了 我 一 些 启示 。 其 核心 思想 是 ， 开 发 新 产品 时 ， 先 
做 出 一 个 简单 的 原型 一 一 最 小 化 可 行 产品 (Minimum Viable Product，MVP)， 这 个 原型 的 
目标 并 不 是 马上 生产 出 一 个 完美 的 产品 , 而 是 为 了 验证 自己 心中 的 商业 假设 。 得 到 用 户 的 
真实 反馈 后 ， 从 每 次 试验 的 结果 中 学 习 ， 再 快速 欠 代 ， 持 续 修 正 ， 在 资源 耗 尽 前 从 迷雾 中 
找到 通 往 成 功 的 道路 ， 最 终 适 应 市 场 的 需求 。 

Eric Rise 在 书 中 强调 ， 精 益 创业 就 是 一 个 “开发 一 测量 一 认 知 ”的 验证 学 习 过 程 ， 如 
图 1-7 所 示 。 也 就 是 说 ， 把 创意 快速 转化 为 产品 ， 衡 量 
顾客 的 反馈 ， 然 后 再 决定 是 改 弛 更 张 ， 还 是 坚守 不 移 。 

该 书 主要 关注 于 创业 初始 阶段 ， 将 精益 思想 贯穿 
于 产品 “从 0 到 1” 的 过 程 。 事 实 上 ， 它 也 可 以 用 于 产 
品 “ 从 1 到 ”的 过 程 中 。 

1996 年 ，Womack、Jones 和 Roos 在 《精益 思想 》 一 
书 中 指出 ， 精 益 思想 是 指导 企业 根据 用 户 需 求 ， 定 义 
企业 生产 价值 ， 按 照 价值 流 来 组 织 全 部 生产 活动 。 使 
价值 在 生产 活动 之 间 流 动 起 来 ， 由 需求 拉动 产品 的 生 
产 ， 从 而 识别 整个 生产 过 程 中 不 经 意 间 产 生 的 浪费 , 二 一 图 LE7 ” 开发 测量 认 知 ” 环 
并 消除 之 。 

在 精益 管理 理论 中 ,“ 浪 费 ” 是 指 从 客户 角度 出 发 ， 对 优质 产品 与 良好 服务 不 增加 价 
值 的 生产 活动 或 管理 流程 。 并 指出 ， 业 务 生产 中 所 有 活动 都 可 以 归结 为 以 下 两 种 活动 , 也 
就 是 增加 价值 的 活动 和 不 增加 价值 的 活动 , 而 不 增加 价值 的 活动 就 是 浪费 ,在 被 归 类 为 “ 浪 
费 ” 的 活动 中 ， 又 可 以 分 为 必要 的 非 增值 活动 和 纯粹 的 浪费 。 必 要 的 非 增值 活动 是 指 从 客 
户 的 角度 看 虽 没 有 价值 ， 却 可 以 避免 (潜在 的 ) 更 大 的 浪费 或 降低 系统 性 风险 的 活动 ， 如 
图 1-8 所 示 。 









































口 无 人 使 用 的 功能 

口 等 待 (等 待 其 他 人 的 支持 或 帮助 、 审 批 ) 
学 必 要 的 浪费 多 工作 项 的 移交 (Handoffs) 

口 库存 (等待 开发 、 等 待 测试 、 等 待 审批 ) 
增值 活动 尝 部 分 完成 的 工作 (WIP) 

学 寻找 信息 (上 下 文 切换 ， 反 复 沟 通 ) 

口 软件 缺陷 (Defects) 

测试 


光 项 目 管理 








图 1-8 软件 产品 开发 中 的 活动 浪费 
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例如 ， 生 产 流水 线 上 的 装配 工作 是 增值 活动 ， 质 量 检 查 是 必要 的 非 增值 活动 ， 而 因 材 
料 供应 不 足 产 生 的 生产 等 待 以 及 因 质 量 缺 陷 导致 的 返工 都 被 认为 是 不 必要 的 浪费 。 在 软件 
产品 服务 的 全 生命 周期 中 ， 也 同样 包含 多 种 “浪费 "， 例 如 ， 无 效果 的 功能 特性 、 各 生产 
环节 中 的 等 待 〈《 如 图 1-9 所 示 )、 没 人 看 的 文档 、 软 件 缺陷 、 机 械 性 的 重复 工作 等 。 





























设计 开发 联 调 测试 发 布 





图 1-9 用 户 视角 的 增值 活动 与 浪费 








尽管 “消除 所 有 浪费 ”几乎 是 不 可 能 的 , 但 是 ,我 们 仍旧 要 全 面 贯 彻 “ 识 别 和 消除 一 
切 浪费 ”的 理念 ， 持 续 不 断 地 优化 流程 与 工作 方式 ， 达 到 高 质量 、 低 成 本 、 无 风险 地 快速 


交付 客户 价值 的 目的 。 
1.2.2 ”双环 模型 

自 2009 年 Flickr (一 个 聚合 全 球 知名 热门 图 片 分 享 网 站 ) 声称 其 网 站 每 天 部 署 10 次 之 
时 起 ,，“ 主 和 干 开发 + 持续 集成 + 持续 发 布 ” 已 成 为 硅谷 知名 互联 网 公司 应 对 VUCA 环 境 的 一 
种 主流 软件 研发 管理 模式 。 这 种 变化 的 原动力 并 不 是 来 自 技术 团队 本 身 ， 而 是 来 自 业 务 与 
产品 方 的 诉求 。 为 了 在 VUCA 环 境 中 更 快 地 了 解 海量 用 户 ， 快 速 验证 大 量 业 务 假设 和 解决 
方案 ， 他 们 改变 了 业务 探索 的 模式 ， 并 催生 了 软件 研发 管理 模式 的 改变 ， 两 种 模式 相互 促 
进 ， 从 而 形成 了 互联 网 软件 产品 研发 管理 的 双环 模式 ， 即 “持续 交付 2.0" ， 如 图 1-10 所 示 。 


天 




















共 创 监测 


图 1-10 ”持续 交付 2.0 的 双环 模型 





“持续 交付 2.0” 是 一 种 产品 研发 管理 思维 框架 。 它 将 精益 创业 与 持续 交付 1.0 相 结合 ， 
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强调 业务 与 IT 间 的 快速 闭环 ， 以 “精益 思想 ”为 指导 ， 全 面 贯 彻 “ 识 别 和 消除 一 切 浪费 ” 
的 理念 ， 通 过 一 系列 工作 原则 与 实践 ， 帮 助 企 业 以 一 种 可 持续 方式 ， 高 质量 、 低 成 本 、 无 
风险 地 快速 交付 客户 价值 。 

对 企业 来 说 ,开发 软件 产品 的 目标 是 创造 客户 价值 。 因 此 ,我们 不 应 该 仅仅 关注 快速 
开发 软件 功能 ， 同 时 还 应 该 关注 我 们 所 交付 的 软件 的 业务 正确 性 ， 以 及 如 何以 有 限 的 资源 
快速 验证 和 解决 业务 问题 。 也 就 是 说 ， 不 断 探 索 发 现 真正 要 解决 的 业务 问题 ， 提 出 科学 的 
目标 ， 设 计 最 小 可 行 解决 方案 。 通 过 快速 实现 解决 方案 并 从 真实 反馈 中 收集 数据 ， 以 验证 
该 问题 是 否 得 以 解决 。 这 是 一 个 从 业务 问题 出 发 ， 到 业务 问题 解决 的 完整 业务 财 环 ， 简 称 
为 持续 交付 “8” 字 环 。 

它 由 两 个 相连 的 环 组 成 : 第 一 个 环 为 “探索 环 "， 甚 主要 目标 是 识别 和 定义 业务 问题 ， 
并 制订 出 最 小 可 行 解 决 方案 进入 第 二 个 环 ， 第 二 个 环 为 “验证 环 "， 甚 主要 目标 是 以 最 快 
速度 交付 最 小 可 行 方案 ， 可 靠 地 收集 真实 反馈 ， 并 分 析 和 验证 业务 问题 的 解决 效果 ， 以 便 
决定 下 一 步行 动 ， 如 图 1-10 所 示 。 

探索 环 包含 4 个 可 持续 循环 步骤 ,分别 是 提问 、 鳃 定 、 共 创 和 精炼 。 

(1) 提问 ， 即 定义 问题 。 通 过 有 针对 性 的 提问 二 找 出 客户 的 具体 需求 ， 并 找 出 具体 需 
求 后 的 原因 ， 即 具体 需求 后 要 解决 的 根本 问题 。 在 提问 中 形成 团队 期 望 达成 的 业务 目标 或 
者 想 要 解决 的 业务 问题 。 如 果 问 题 无 法 清晰 定义 , 那么 找到 的 答案 自然 就 会 有 偏差 。 因 此 ， 
在 寻找 答案 之 前 ， 应 该 先 清 晰 地 定义 问题 。 

(2) 锚 定 ， 即 定义 结果 目标 指示 器 。 针 对 问题 进行 信息 收集 ， 经 过 分 析 ， 去 除 干扰 信 
息 ， 识 别 问题 假设 ， 得 到 适当 的 衡量 指标 项 ， 并 用 其 描述 现在 的 状况 ， 同 时 讨论 并 定义 我 
们 接 下 来 的 行动 所 期 望 的 结果 。 

(3) 共 创 ， 即 共同 探索 和 创造 解决 或 验证 该 问题 的 多 种 具有 可 行 性 的 解决 方案 。 

(4) 精炼 ， 即 对 所 有 的 可 行 试 验方 案 进行 选择 ， 找 到 最 小 可 行 性 解决 方案 ， 它 既 可 能 
是 单个 方案 ， 也 可 能 是 多 个 方案 的 组 合 。 

验证 环 也 包含 4 个 可 持续 循环 的 步 又， 分 别 是 构建 、 运 行 、 监 测 和 决策 。 

(1) 构建 : 是 指 根据 非 数 字 化 描述 ,将 最 小 可 行 性 解决 方案 准确 地 转换 成 符合 质量 要 
求 的 软件 包 。 

(2) 运行 : 是 指 将 达到 质量 要 求 的 软件 包 部 署 到 生产 环境 或 交 到 用 户 手 中 ， 并 使 之 为 
用 户 提供 服务 。 

(3) 监测 是 指 收集 生产 系统 中 产生 的 数据 ， 对 系统 进行 监控 ， 确 保 其 正常 运行 。 同 
时 将 业务 数据 以 适当 的 形式 及 时 呈现 出 来 。 

(4) 决策 : 是 指 将 收集 到 的 数据 信息 与 探索 环 得 出 的 对 应 目标 进行 对 比分 析 ， 做 出 决 
策 ， 确 定 下 一 步 的 方向 。 
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探索 环 就 像 是 一 部 车 子 的 前 轮 ， 把 握 前 进 方向 。 验 证 环 则 像 车 子 的 后 轮 ， 使 车 子平 稳 
且 驱 动 快速 前 进 。 它 们 之 间 相 互 促进 ， 探 索 环 产 生 的 可 行 性 方案 规模 越 小 ， 越 能 够 提高 验 
证 环 的 运转 速度 ; 如 果 价 值 验证 环 能 够 提高 运转 速度 , 则 有 利于 探索 环 尽早 得 到 真实 反馈 ， 
有 利于 快速 决策 ， 及 时 对 前 进 方向 进行 验证 或 调整 。 
1.2.3 4 个 核心 原则 

“持续 交付 2.0” 是 指 企 业 能 够 以 可 持续 发 展 的 方式 ， 在 高 质量 、 低 成 本 及 无 风险 的 前 
提 下 ， 不 断 缩短 持续 交付 “8” 字 环 周期 ， 从 而 与 企业 外 部 频繁 互动 ， 获 得 及 时 且 真 实 的 
反馈 ,最终 创造 更 多 客户 价值 的 能 力 。 下 面 未 一 介绍 缩短 持续 交付 “8” 字 环 周期 的 4 个 核 
心 工 作 原 则 。 


























1. 坚持 少 做 
在 咨询 的 过 程 中 ， 最 常 听 到 的 一 句 话 就 是 :“ 我 们 最 大 的 问题 是 人 力 不 足 。” 无 论 公 司 
实力 如 何 ， 想 做 的 事情 永远 超过 自己 的 交付 能 力 ， 需求 永 远 做 不 完 。 然 而 ， 做 得 多 就 一 定 











有 效 吗 ?我 们 应 该 抵 住 “通过 大 量 计划 来 构建 最 佳 功 能 ”的 诱惑 ， 坚 持 少 做 ， 想 办 法 对 新 
创意 尽早 验证 。 

Moran 在 Do Jt Wrong Quickly 一 书 中 写 道 “Netflix 认 为 ， 他 们 想 做 的 事情 中 ， 可 能 有 
90% 是 错误 的 。” Ronny Kohavi 等 共同 发 布 的 文章 “Online Experimentation at Microsoft” 中 
也 指出 ， 在 微软 ,“ 那 些 旨 在 改进 关键 指标 而 精心 设计 和 开发 的 功能 特性 中 ， 只 有 1/3 左 右 
成 功 地 改进 了 关键 指标 ”。 

正如 当年 Mike Krieger (Instagram 的 联合 创始 人 兼 CTIO) 被 问 及 “5 个 工程 师 如 何 支 持 
4000 万 用 户 ” 时 所 说 的 那样 “ 少 做 ， 先 做 简单 的 事情 ”。 

2. 持续 分 解 问题 

复杂 的 业务 问题 中 一 定 会 包含 很 多 不 确定 因素 ， 它 们 会 影响 问题 解决 的 速度 和 质量 。 
在 实施 解决 方案 之 前 , 通过 对 问题 的 层 层 分 解 ,可 以 让 团队 更 了 解 业务 , 更 早 识别 出 风险 。 
企业 应 该 坚信 ， 即 便 是 很 大 的 课题 或 者 大 范围 的 变更 ， 也 可 以 将 其 分 解 为 一 系列 小 变更 ， 
快速 解决 ， 并 得 到 反馈 ， 从 而 尽早 消除 风险 。 与 其 设计 一 大 堆 特 性 ， 再 策划 一 个 持续 数 月 
的 一 次 性 发 布 ， 不 如 持续 不 断 地 尝试 新 想法 ， 并 各 自 独立 发 布 给 用 户 。 

3. 坚持 快速 反馈 

当 把 问题 分 解 以 后 ， 如 果 我 们 仍旧 只 是 一 味 地 埋头 若干, 而 忽视 对 每 项 已 完成 工作 的 
结果 反馈 ， 那 么 就 失去 了 由 问题 分 解 带 来 的 另 一 半 收 益 ， 确 认 风 险 降低 或 解除 。 只 有 通过 
快速 反馈 ， 我 们 才能 尽早 了 解 所 完成 工作 的 质量 和 效果 。 

4. 持续 改进 并 衡量 

无 论 做 了 什么 样 的 改进 ， 如 果 无 法 以 某 种 方式 衡量 它 的 结果 ， 就 无 法 证 明 真 的 得 到 了 
改进 。 在 着 手 解 决 每 个 问题 之 前 ， 我 们 都 要 找到 适当 的 衡量 方式 ， 并 将 其 与 对 应 的 功能 需 
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求 放 在 同等 重要 的 位 置 上 ， 一 起 完成 。 

某 数据 公司 就 曾 因 无 度量 数据 ， 而 无 法 提出 有 效 改进 方向 的 情况 。 该 系统 是 一 个 数 
据 标注 志愿 者 招募 雳 试 系统 。 虽 然 它 被 分 成 多 个 欠 代 ， 每 个 迭代 都 发 布 了 很 多 功能 ， 但 
是 ， 由 于 没有 实现 产品 人 员 所 关注 的 数据 收集 与 统计 分 析 功 能 ， 使 得 团队 仅 知道 人 们 可 
以 使 用 这 个 系统 完成 工作 ， 却 无 法 知道 是 否 能 够 高 效 完成 工作 ， 也 很 难 提 出 下 一 步 的 产 
品 优化 方向 。 


1.2.4 持续 交付 七 巧 板 


我 们 讨论 了 “持续 交付 2.0” 的 指导 思想 、 工 作 理 念 和 核心 原则 。 大 家 很 容易 意识 到 ， 
它 对 适应 快速 变化 的 市 场 环境 和 激烈 的 市 场 竞 争 是 非常 有 效 的 。 那么 ,企业 如 何 让 “持续 
交付 2.0” 成 为 一 种 组 织 能 力 ， 成 为 组 织 的 DNA， 持 续 发 挥 作用 ， 从 而 领先 竞争 对 手 ， 成 
为 自己 的 一 种 竞争 优势 呢 ? 

持续 交付 双环 模型 的 实施 与 改进 将 涉及 企业 内 的 多 个 部 门 与 不 同 的 角色 , 无 法 由 某 个 
部 门 独立 实施 ， 必 须 在 整个 组 织 范 围 内 贯彻 执行 “持续 交付 2.0” 的 思想 、 理 念 与 原则 。 企 
业 需 要 在 组 织 管理 机 制 、 基 础 设施 以 及 软件 系统 架构 3 个 方面 付 诸 行动 ， 而 每 一 个 方面 都 
包含 多 项 内 容 ， 如 图 1-11 所 示 。 
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图 1-11 “持续 交付 七 巧 板 


条 条 大 路 通 罗 马 , 而 且 , 罗马 也 不 是 一 天 建成 的 。 每 个 企业 的 实施 路 径 可 能 各 不 相同 ， 
所 需要 的 周期 也 各 有 长 短 ， 对 各 方面 的 能 力 需求 也 不 完全 一 致 。 正 如 中 国 传统 玩具 七 巧 板 
一 样 ， 每 个 企业 都 应 根据 自己 的 意愿 和 诉求 ， 拼 出 属于 自己 的 持续 交付 实践 地 图 。 
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1.3 人 小结 


“持续 交付 2.0” 建 立 在 “持续 交付 1.0” 的 “可 持续 地 快速 发 布 软件 服务 ”及 精益 创业 
的 “最 小 化 可 行 产品 ”两 种 理念 基础 之 上 ， 强 调 要 以 业务 为 导向 ， 从 一 开始 就 将 业务 问题 
进行 分 解 ， 并 通过 不 断 的 科学 探索 与 快速 验证 ， 减 少 浪费 的 同时 ， 快 速 找到 正确 的 业务 前 
进 方向 ， 简 称 为 “双环 模型 *。 因 此 ， 其 涉及 组 织 中 的 多 个 团队 ， 需 要 各 个 团队 之 间 紧 密 
合作 ， 才 能 缩短 “8” 字 环 的 周期 ， 如 图 1-12 所 示 。 
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图 1-12 ”持续 交付 2.0 的 相关 角 


“持续 交付 2.0” 的 4 个 核心 工作 原则 是 坚持 少 做 、 持 续 分 解 问题 、 坚 持 快速 反馈 和 持 
续 改进 并 衡量 。 只 有 这 样 ， 才 能 不 断 缩 短 持续 交付 “8” 字 环 的 运行 周期 ， 提 升 用 户 反馈 
速度 ， 从 而 提高 业务 的 敏捷 性 。 这 要 求 管理 者 跳出 原 有 软件 交付 管理 思维 模式 ， 摆 脱 “ 害 
怕 失 败 ” 的 念 惧 感 ， 拥 抱 “ 科 学 探索 一 快速 验证 ”思维 方法 ， 快 速 试 错 ， 提 升 持续 交付 能 
力 ， 进 而 发 展现 有 业务 ， 并 快速 开创 新 业务 。 
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6k6 我 们 最 优先 要 做 的 是 通过 尽早 、 持 续 地 交付 有 价值 的 软件 来 使 客户 满意 "， 这 是 敏 
捷 开 发 十 二 原则 的 第 一 条 。 然 而 ， 对 于 “什么 是 价值 ? ”这 个 问题 ， 组 织 中 的 每 
个 人 可 能 都 会 有 自己 的 看 法 。 管 理 大 师 彼得 " 德 鲁 克 说 ,“ 价 值 只 能 由 企业 外 部 的 客户 来 
定义 ”。 一 个 新 产品 的 推出 ， 可 能 是 灵机 一 动 的 产物 ， 也 可 能 是 大 量 市 场 调查 的 结果 ， 能 
否 被 市 场 接受 ， 只 有 用 户 说 了 算 。 如 今 ， 客户 已 不 再 满足 于 类 似 “ 办 公 室 的 打印 机 能 够 清 
晰 打印 ”这 种 基本 功能 需求 ， 而 是 有 了 更 多 的 高 级 需求 。 
如 何 发 现 和 识别 用 户 的 真实 需求 是 目前 所 有 企业 面临 的 难题 。 本 章 主要 讨论 持续 交付 
“8” 字 环 中 的 探索 环 〈 如 图 2-1 中 的 方 框 所 示 ) 中 原则 与 方法 。 通 过 一 系列 方法 ， 帮 助 大 家 
分 析 和 解决 这 一 问题 。 
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图 2-1 ”持续 交付 “8” 字 环 中 的 探索 环 





2.1 探索 环 的 意义 


当 很 多 企业 设计 开发 新 产品 时 ， 项 目 早期 会 采用 “概念 验证 ”或 “产品 原型 法 ”， 收 
集 潜 在 用 户 的 反馈 ， 以 降低 产品 方向 产生 错误 的 风险 。 一 旦 接受 了 这 些 概念 验证 与 产品 原 
型 后 ， 企 业 就 会 启动 一 个 历时 较 长 的 产品 完整 功能 开发 过 程 。 而 相对 于 最 终 产 品 来 说 ， 这 
些 概念 验证 与 产品 原型 本 身 就 是 不 完整 的 ， 因 此 总 会 有 一 些 差异 。 
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现在 的 市 场 变 化 很 快 ， 当 花 大 量 时 间 将 产品 功能 全 部 开发 完成 后 ， 产 品 常会 因为 法 
在 用 户 对 原型 的 理解 偏差 ， 或 者 用 户 需求 发 生 了 变化 ， 导 致 当初 的 设计 不 再 适应 市 场 需 
求 。 事 实 上 ， 这 反映 了 产品 或 服务 开发 过 程 中 常见 的 风险 假设 。 一 是 用 户 假设 ， 即 我 们 
提供 的 产品 服务 是 针对 某 类 将 在 用 户 人 群 的 需求 的 假设 ， 二 是 问题 假设 ， 即 目标 用 户 群 
之 所 以 有 这 种 需求 ， 是 因为 他 们 的 确 存 在 某 些 痛 点 〈 或 问题 ) 需要 解决 的 假设 ， 三 是 解 
决 方案 假设 ， 即 我 们 提供 的 解决 方案 可 以 解决 这 些 痛 点 或 问题 ， 而 且 比 其 他 现存 的 解决 
方案 都 有 效 且 高 效 。 

这 3 类 假设 中 ,任何 一 个 假设 不 成 立 ， 都 会 导致 我 们 事倍功半 ， 其 至 前 功 尽 弃 。 因 此 ， 
探索 环 的 目标 就 是 要 持续 识别 和 定义 这 些 有 价值 的 假设 , 选择 并 验证 其 中 风险 最 高 或 最 易 
验证 的 价值 假设 ， 并 借助 价值 验证 环 得 到 数据 反馈 ， 以 便 深 入 理解 用 户 需求 ， 把 握 业 务 前 
进 方向 。 

例如 ， 持 续 交 付 工具 GoCD (一 款 面向 软件 研发 过 程 管理 的 产品 ) 在 其 启动 之 初 ， 目 
标 客户 就 被 定义 为 那些 希望 以 敏捷 开发 方式 交付 软件 ,并 希望 提升 软件 交付 速度 与 质量 的 
中 小 软件 企业 或 团队 ， 直 到 现在 也 没有 变化 。 产 品 希 望 解决 的 主要 问题 仍旧 是 这 些 客户 在 
开发 软件 过 程 中 的 集成 与 发 布 管理 问题 。 然 而 ， 在 2007 年 项 目 启动 时 曾经 规划 的 近 两 百 个 
功能 特性 中 ， 到 目前 为 止 ， 儿 乎 有 一 半 的 规划 特性 被 废弃 了 。 因 为 这 些 功 能 特性 并 不 是 解 
决 中 小 软件 企业 的 软件 集成 与 发 布 管理 问题 的 最 佳 解决 方案 。 这 也 说 明 ， 在 2007 年 时 ,该 
产品 解决 方案 中 的 很 多 假设 是 不 成 立 的 。 

该 产品 研发 过 程 中 实际 上 一 直 秉 和 水“ 持续 交付 2.0” 的 理念 ， 通 过 将 大 特性 分 解 成 多 
个 小 功能 ， 持 续 快速 发 布 (团队 每 周 使 用 自己 的 最 新 版 本 ， 并 且 每 两 周 对 外 部 客户 发 布 
次 )， 获 得 真实 用 户 反馈 ， 从 而 调整 产品 功能 策略 ， 为 产品 成 功 打下 了 基础 。 

因此 , 在 探索 环 中 , 我 们 就 是 要 从 业务 问题 出 发 , 与 团队 一 起 , 共同 找 出 这 3 类 假设 ， 
通过 分 析 评 估 ， 确 认 最 大 的 风险 点 ， 并 制订 相关 的 衡量 指标 ， 找 出 相应 的 最 小 可 行 的 验 
证 方案 。 然 后 再 借助 验证 环 的 高 速 运转 ， 尽 早 获得 反馈 ， 并 根据 衡量 指标 来 验证 这 些 风 
险 点 。 
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探索 环 (Discovery Loop) 是 指 团队 通过 一 系列 工作 环节 ， 能 够 识别 和 定义 业务 问题 ， 
制订 相应 的 衡量 指标 ， 并 找 出 低 成 本 且 可 快速 验证 的 最 小 可 行 解决 方案 (Minimum Viable 
Solution)。 这 是 一 个 理解 真实 需求 、 判 断 优先 级 、 再 评估 需求 的 过 程 ， 具体 包 括 以 下 4 个 
环节 。 

(1) 提问 : 通过 有 针对 性 的 提问 与 讨论 ， 找 出 团队 期 望 达成 的 业务 目标 或 者 希望 解决 
的 业务 本 质问 题 。 
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(2) 锚 定 : 针对 该 问题 进行 信息 收集 ， 经 过 分 析 , 去除 干扰 信息 , 得 到 适当 的 指标 项 ， 
并 用 其 描述 现在 的 状况 ， 以 及 我 们 希望 的 结果 或 状态 。 

(3) 共 创 : 通过 深入 讨论 ， 找 到 所 有 可 能 的 解决 方案 。 它 是 一 个 深入 理解 和 验证 问题 
的 环 证 。 

(4) 精炼 : 结合 实际 情况 ， 进 行 评 估 ， 算 选 出 最 小 可 行 性 解决 方案 或 方案 的 集合 ， 以 
作为 验证 环 的 输入 。 等 待 它 的 真实 反馈 ， 再 做 价值 判断 。 

以 下 详 述 实施 这 4 个 关键 步骤 的 具体 方法 。 


2.2.1 提问 


























该 环节 是 持续 交付 “8” 字 环 的 起 点 。 其 目的 在 于 通过 不 断 地 提问 ， 淤 清 客户 需求 背 
后 要 实现 的 真正 目标 ， 以 便 找寻 更 多 解决 问题 的 方法 ， 同 时 也 有 助 于 团队 成 员 从 业务 问题 
出 发 ， 充 分 理解 业务 问题。 

敏捷 软件 开发 方法 已 经 非常 流行 ,“ 用 户 故 事 ” 作 为 一 种 描述 需求 的 方式 也 被 广泛 采 
用 ， 然 而 ， 软 件 研发 团队 更 关注 “需求 是 什么 ”的 问题 。 例 如 ， 我 们 经 常 遇 到 下 面 这 种 团 
队 需 求 讨论 的 场景 。 








业务 人 员 : 你 按照 这 个 文档 中 的 业务 流程 和 界面 料 例 开发 就 行 了 。 

开发 人 员 : 这 个 流程 走 到 这 里 时 ， 遇 到 (和 ) 这 种 稍 况 时 ， 这 个 字段 里 应 
该 包含 哪些 选项 ? 

业务 人 员 : 你 可 以 这 么 做 (……… ) 

开发 人 员 : 那 这 样 处 理 以 后 ， 接 下 来 怎么 办 ? 


上 述 的 提问 目标 是 证 清 用 户 的 直接 需求 〈《 即 业务 人 员 提出 的 解决 方案 )。 从 “满足 客 
户 需求 ”的 服务 心态 来 看 ， 这 样 的 工作 方式 也 没有 什么 问题 。 然 而 ， 按 照 业务 人 员 编 写 的 
文档 开发 ， 就 能 请 足 他 们 真实 的 需求 吗 ? 

探索 环 中 的 提问 环 市 要 求 不 仅仅 是 找到 “实现 什么 ”以 及 “如 何 实现 ”， 更 是 要 了 解 
客户 需求 背后 要 解决 的 真正 问题 “为 什么 要 实现 ”， 以 便 规划 更 加 方便 快捷 的 验证 方案 或 
解决 方案 。 

由 于 角色 惯性 , 从 开始 讨论 的 那 一 刻 起 , 我 们 就 很 容易 跳 过 最 重要 的 问题 , 也 就 是 说 ， 
如 何 更 好 地 为 客户 解决 真正 的 问题 ， 而 这 恰恰 是 我 们 应 该 做 的 。 因 此 ， 要 通过 持续 提问 ， 
对 问题 进行 深入 探究 。 

设想 一 下 ， 我 们 正 举办 一 个 为 期 一 天 且 付 费 的 小 型 线 下 聚会 ， 主 题 是 “DevOps 和 持 
续 交 付 2.0"。 午 休 期 间 ， 有 位 听众 希望 下 午 能 够 喝 上 一 杯 星 巴克 咖啡 。 为 了 更 好 地 为 客户 
服务 , 作为 主办 方 , 我 们 耐心 地 询问 他 “需要 哪 种 口味 的 咖啡 9 ”“ 热 的 , 还 是 冰 的 ? ”大 
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杯 ， 还 是 中 杯 ? ”“ 希 望 什么 时 间 拿 到 ? ”。 

然而 ， 所 有 这 些 问题 都 只 是 在 问 “ 做 什么 ”和 “怎么 做 ”， 并 没有 任何 一 名 问 及 原因 。 
如 果 客 户 想 要 解决 的 真正 问题 是 “在 下 午 听 讲 时 不 会 因为 困 意 而 错过 了 听讲 ”， 我 们 也 许 
有 很 多 方法 解决 他 的 诉求 ? 也 许 我 们 可 以 录制 视频 ， 这 样 即 使 参与 者 在 过 程 中 开小差 ， 在 
沙龙 结束 后 ， 他 们 也 能 够 回顾 一 下 沙龙 的 所 有 内 容 。 我 们 还 有 更 多 的 方法 来 满足 用 户 不 错 
过 精彩 内 容 的 需求 。 例 如 : 

(1) 沙龙 的 组 织 者 可 以 将 演讲 模式 改 成 互动 参与 模式 ， 增 加 互动 环 市 。 

(2) 安排 站 立 区 ， 人 允许 参与 者 走动 。 

(3) 发 言 者 的 发 言 更 有 吸引 力 。 

(4) 在 会 场 角 落 提供 其 他 冷 热饮 品 

这 个 假想 的 案例 可 能 并 不 准确 , 但 你 一 定 已 经 领会 了 其 中 的 含义 。 的 确 ， 为 了 解决 客 
户 的 问题 ， 我 们 可 能 会 找到 很 多 种 解决 方案 ,但 前 提 是 我 们 必须 发 现 “ 正 确 的 需求 "。 所 
谓 “ 正 确 的 需求 " ， 是 那些 能 够 解决 客户 真正 想 要 解决 的 问题 ， 而 不 一 定 是 由 客户 提出 的 
解决 方案 。 

因此 ， 当 我 们 接 到 一 个 工作 任务 时 ， 我 们 应 该 更 多 地 深入 理解 所 要 解决 的 问题 ， 了 解 
其 背后 的 真正 原因 ， 不 要 过 早 地 进入 解决 方案 环节 的 讨论 ， 而 忽视 了 对 问题 的 讨论 。 这 样 
才能 更 好 地 解决 问题 ， 而 不 仅仅 是 完成 软件 功能 的 开发 工作 。 

在 “提问 ”这 一 环节 中 ， 组 织 者 需要 注意 以 下 4 点 。 

(1) 问题 域 的 提出 方 及 解决 方案 的 提供 方 代表 尽量 到 场 ， 参 与 讨论 。 

(2) 多 问 几 个 “为 什么 "。 尽量 避免 因为 感觉 自己 熟悉 这 个 问题 域 , 而 过 早 地 放弃 探索 。 

(3) 在 条 件 允 许 的 情况 下 ， 尽 可 能 收集 数据 信息 ， 以 便 作 为 问题 理解 和 分 析 的 佐证 。 

(4) 移 情 ， 使 用 同 理 心 。 设 身 处 地 站 在 客户 或 问题 提出 方 的 角度 思考 问题 ， 还 原 客 户 
问题 的 场景 。 


2.2.2 锚 定 


当 我 们 已 经 选 定 要 解决 的 问题 领域 时 ， 接 下 来 就 要 确定 我 们 要 达成 的 具体 目标 与 结 
果 。 错 定 “是 设 定 目标 以 及 目标 分 解 的 讨论 过 程 ， 其 目的 是 确定 要 达成 的 目标 以 及 可 以 
衡量 它 的 指标 ， 并 能 够 指导 后 续 的 共 创 与 精炼 活动 。 

我 们 应 该 尽量 避免 模糊 不 清 的 目标 ， 它 会 影响 团队 成 员 之 间 的 交流 。 清 晰 地 描述 目标 
让 我 们 自己 知道 当前 所 在 的 位 置 ， 离 目标 还 有 多 远 。 只 有 这 样 ， 我 们 才能 以 终 为 始 ， 结 合 
现实 环境 ， 选 择 和 制订 相对 合理 的 解决 方案 。 清 晰 的 目标 通常 是 具体 且 可 衡量 的 ， 并 有 时 
间 限 定 。 如 果 没 有 时 间 限 定 ， 它 很 可 能 会 成 为 一 个 企业 愿景 ， 就 无 法 直接 指导 企业 日 常生 
产 管理 的 具体 活动 ， 如 图 2-2 所 示 。 
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现状 两 个 月 后 愿景 
服务 于 服务 于 服务 于 
10 万 用 户 ”20 万 用 户 1000 万 用 户 





图 2-2 愿景 与 目标 


最 好 的 方式 是 让 目标 可 客观 衡量 。 有 时 ， 我 们 很 难 立即 拿 出 一 个 可 衡量 的 标准 。 但 是 ， 
我 们 可 以 通过 描述 目标 状态 , 并 根据 这 一 目标 状态 可 能 产生 的 结果 来 寻找 可 客观 衡量 的 目标 
结果 。 如 何 发 现 可 衡量 的 指标 呢 ?” 我 们 可 以 这 样 来 思考 :如果 蘑 个 产品 满足 了 用 户 的 需求 ， 
那么 用 户 会 非常 满意 , 而 用 户 的 满意 会 带 来 复 购 ， 同 时 会 有 更 好 的 品牌 知名 度 ， 从 而 带 来 更 
多 的 用 户 。 那 么 ， 我 们 是 否 可 以 设 定 用 户 数量 和 营业 收入 作为 产品 的 指标 维度 ， 如 图 2-3 所 
示 。 这 两 个 指标 的 特点 是 : 容易 收集 和 容易 量化 ， 这 有 利于 降低 收集 衡量 指标 的 成 本 。 
满足 了 用 户 的 需求 


用 户 会 非常 满意 
用 户 数 





























用 户 会 传播 


用 户 会 复 购 
图 2-3 易 收 集 、 易 量化 的 目标 


例如 ， 对 某 个 提供 新 闻 信息 流 服 务 (Feed 流 ) 的 移动 应 用 产品 来 说 ， 企 业 希 望 “ 让 用 
户 喜欢 它 所 提供 的 信息 服务 ”。 然 而 ,，“ 喜 欢 ” 是 一 个 很 难 量 化 和 佐证 的 目标 ,这 就 需要 进 
一 步 锚 定 。 如 图 2-4 所 示 ， 我 们 可 以 推断 ， 假 如 用 户 喜 欢 这 个 产品 ， 那 么 : 

(1) 用 户 会 阅读 更 多 的 内 容 ， 而 且 会 花费 更 长 的 时 间 。 

(2) 用 户 会 将 产品 推荐 给 朋友 ， 朋 友 们 也 会 喜欢 并 成 为 产品 的 用 户 。 














推荐 朋友 数 < 


i val NR ee EL 
EC 1 单个 用 户 ， | | 
， 单位 时 间 内 ， 用 户 喜欢 | 平均 使 用 时 长 | ~ 增强 环 路 
0 Ro 0 


图 2-4 ”Feed 流 产品 的 指标 选择 示意 图 
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从 上 面 的 假设 中 ， 我 们 提 及 3 个 易 收集 和 易 衡量 的 指标 ， 它 们 分 别 是 推荐 朋友 数 、 单 
位 时 间 内 的 用 户 数 和 单个 用 户 平均 使 用 时 长 。 这 3 个 指标 都 能 作为 企业 目标 的 指标 维度 。 
到 底 选 择 哪 些 指标 作为 目标 ， 需 要 根据 企业 现状 、 产 品 处 在 的 生命 周期 阶段 以 及 外 部 市 场 
环境 进行 综合 判断 来 决定 。 

另外 ， 目 标 需要 针对 不 同 的 组 织 层级 而 设 定 。 一 个 企业 的 总 目标 应 该 是 整个 企业 范围 
内 的 目标 ， 而 不 应 该 只 是 企业 中 某 个 团队 的 目标 。 一 旦 制订 了 企业 总 目标 ， 企 业 中 的 每 个 
团队 都 要 以 它 为 方向 ， 根 据 自身 团队 的 职责 与 性 质 ， 制 订 各 自 相应 的 目标 ， 并 为 实现 它 而 
集思广益 ， 和 群策群力 。 例 如 ， 提 高 用 户 操作 的 流畅 度 ， 提 高 API 请 求 的 响应 速度 ， 推 荐 给 
用 户 更 多 他 们 喜欢 的 内 容 ， 提 高 后 台 服 务 稳定 性 ， 等 等 (如 图 2-5 所 示 )。 
目标 




















年 底 服务 于 
200 万 用 户 








总 目标 与 子 





对 于 目标 的 选择 ， 应 该 遵循 两 点 : 一 是 识别 价值 指标 ,而 非 虚荣 指标 ， 二 是 指标 应 该 
可 衡量 且 可 获取 ， 易 于 客观 对 比 。 虚 荣 指标 这 一 概念 是 《精益 创业 》 一 书 中 提 及 的 。 它 是 
指 让 你 的 产品 效果 看 起 来 很 好 的 那些 指标 ， 如 注册 用 户 数 、 网 站 最 高 访问 量 等 。 虽 然 这 些 
指标 在 一 定 程度 上 反映 了 产品 的 状态 ,但 并 不 是 最 有 价值 的 衡量 指标 。 相 比较 而 言 ， 日 活 
跃 用 户 、 月 活跃 用 户 、 日 留存 率 、 月 留存 率 、 有 效 购买 率 等 可 能 是 更 好 的 价值 衡量 指标 。 

当然 ， 对 于 更 加 具体 的 问题 域 或 者 产品 阶段 ， 我 们 还 会 发 现 比 活跃 用 户 、 留 存 率 等 更 
恰当 的 价值 衡量 指标 。 这 需要 团队 根据 业务 特点 及 阶段 侧重 点 自行 发 据 和 定义 。 


2.2.3” 共 创 


共 创 就 是 指 : 当 我 们 制订 了 想 要 达到 的 目标 后 , 团队 为 设法 验证 或 达成 目标 而 找 出 多 
种 可 行 性 解决 方案 的 过 程 。 共 创 要 在 理解 问题 和 制订 目标 之 后 进行 ， 否 则 会 因为 缺少 目标 











20 第 2 章 价值 探索 环 





约束 ,使 得 解决 方案 容易 过 于 发 散 。 这 一 环节 的 产 出 应 该 是 很 多 带 有 量化 指示 器 的 解决 方 
案 。 事 实 上， 每 一 个 解决 方案 都 是 基于 一 定 的 假设 条 件 或 猜想 得 出 的 ， 而 每 一 个 假设 都 等 
同 于 一 个 风险 项 。 因 此 ， 每 个 解决 方案 都 只 是 “试验 方案 ”， 试 图 解决 问题 域 中 的 某 个 具 
体 问题 。 

这 一 环节 的 分 析 方 法 有 很 多 ， 在 这 里 介绍 其 中 的 两 个 ， 一 是 “量化 式 影 响 地 图 ";， 二 
是 “用 户 旅行 地 图 ”。 

1. 量化 式 影响 地 图 

Gojko Adzic 在 《影响 地 图 : 让 你 的 软件 产生 真正 的 影响 力 》 中 解释 了 什么 是 影响 地 图 ， 
它 是 用 Why-Who-How-What 的 分 析 法 , 通过 结构 化 的 显示 方式 (如 图 2-6a 所 示 ), 让 团队 寻 
找 达 成 业务 目标 的 方法 。 对 科学 验证 来 说 , 这 还 显得 不 够 完整 。 我 们 不 但 应 该 知道 “做 XXX 
可 以 影响 YYY”， 还 应 该 了 解 当 前 的 影响 程度 ， 以 及 对 实施 后 达到 效果 的 预期 。 也 就 是 ， 
从 业务 问题 域 出 发 ， 按 “角色 一 影响 一 方案 一 量化 ”的 顺序 进行 讨论 ， 如 图 2-6b 所 示 ， 从 
而 尽 可 能 多 地 发 据 出 可 行 性 解决 方案 。 我 们 可 以 称 它 为 “量化 式 影 响 地 图 ”。 



































(a) 影响 地 图 Cb) 量化 式 影响 地 图 
图 2-6 ”量化 式 影响 地 图 


量化 式 影响 地 图 的 具体 制作 步骤 如 下 所 示 。 

(1) 角色 : 列 出 该 问题 域 所 涉及 的 人 或 角色 。 

(2) 影响 : 针对 每 类 人 或 角色 ， 思 考 他 们 有 哪些 途径 可 以 影响 该 问题 的 解决 ( 既 可 能 
是 积极 的 影响 ， 也 可 能 是 消极 的 影响 )。 

(3) 方案 : 针对 每 一 种 途径 ， 讨 论 并 列 出 所 有 可 能 影响 该 问题 的 解决 方案 。 

(4) 量化 : 如 果 可 能 ， 尽 量 为 每 个 解决 方案 定义 一 个 可 衡量 的 指标 项 。 

下 面 ， 我 们 以 某 移动 App 应 用 的 用 户 增长 目标 (两 个 月 后 达到 20 万 用 户 ) 为 例 ， 可 能 
涉及 的 内 外 部 人 员 包 括 : (1) App 的 使 用 者 ，(2) 推广 渠道 ，(3) 客服 团队 ;(4) 产品 研 
发 运营 团队 ;(5) 内 容 提供 商 以 及 更 多 角色 。 按 照 上 面 给 出 的 4 个 步骤 ， 列 出 多 种 可 实施 
方案 ， 如 图 2-7 所 示 。 
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角色 影响 方案 量化 
通过 私人 社交 网 络 影响 其 朋友 对 分 享有 奖 分 享 数量 增长 指标 
产品 的 印象 
Ap 合用 者 《 写 App 应 用 商店 的 评语 ， 影 响 其 他 操作 成 功 后 提示 评价 分 享 质量 指标 
FAPP 人 对 产品 的 印象 和 下 载 量 
通过 新 媒体 撰写 产品 体验 文章 ， 影 征文 竞赛 
响 读者 对 产品 的 印象 
App 的 展示 位 置 购买 Ce 
下 载 数量 指标 
wor eee 搜索 优化 
App 的 审核 速度 保持 沟通 ， 掌 握 规范 更 新 
两 个 月 内 0 ha 
达到 20 万 < 单位 时 间 的 回复 数量 建立 常用 知识 库 
用 户 客服 人 员 。 用 户 服务 满意 度 话 术 培训 服务 满意 度 指标 
回复 及 时 性 智能 机 器 人 回复 
单位 时 间 内 的 处 理 量 智能 机 器 人 审核 
内 容 市 核 人员 内 容 数量 与 质量 
内 容 质量 质量 标准 培训 、 关 键 信息 索引 表 
内 容 质量 建立 标准 ， 培 训 辅导 
i 内 容 数 量 与 质量 
内 容 生 产 才 人 记 容 生产 邓 提供 工具 ， 培 训 辅 导 Se 














图 2-7 量化 式 影响 地 图 示例 


我 们 有 时 无 法 马上 对 所 有 指标 进行 量化 。 例 如 还 没有 收集 和 统计 过 与 指标 相关 的 数 
据 。 此 时 可 临时 性 地 收集 一 部 分 数据 ， 并 进行 相应 的 推断 ， 通 过 一 段 时 间 的 运行 ， 进 行 指 
标量 化 的 校准 即 可 。 例 如 ， 某 公司 希望 提升 研发 效率 10% (目标 )， 其 中 一 个 方案 是 提升 运 
维 人 员 的 部 署 操 作 效率 。 但 是 ， 之 前 并 没有 收集 过 部 署 操 作 所 需 时 间 。 因 此 ， 我 们 利用 一 
周 时 间 ， 对 当 周 进行 的 两 次 部 署 任 务 进行 了 数据 采集 ， 并 据 此 进行 推断 ， 共 同 定义 了 团队 
认可 的 部 署 操作 时 间 周 期 。 另 一 种 可 能 是 希望 衡量 的 指标 较 难 直接 量化 。 此 时 可 通过 一 些 
过 程 指 标 或 相近 指标 来 禁 代 。 需 要 注意 的 是 ， 这 两 种 情况 都 存在 一 定 的 偏差 ， 因 此 在 数据 
的 应 用 过 程 中 ， 应 该 格外 注意 。 

2. 用 户 旅行 地 图 

用 户 旅行 地 图 (userjourney map) 是 指 以 可 视 化 方式 ， 将 用 户 与 产品 或 服务 之 间 的 互 
动 ， 按 业务 流 分 阶段 呈现 出 来 。 用 户 旅 行 地 图 通常 包括 以 下 4 部 分 。 

(1) 用 户 接触 点 : 旅程 中 的 重要 关键 时 刻 (如 短信 消息 、 软 件 操作 界面 等 )。 

(2) 接触 阶段 : 将 整个 旅程 按 顺 序 划分 成 不 同 的 阶段 (例如 商品 查询 、 下 单 、 付 款 等 )。 

(3) 用 户 痛 点 : 在 用 户 与 系统 服务 的 互动 过 程 中 ， 对 什么 感到 不 足 。 

(4) 用 户 情绪 : 在 旅程 中 的 每 一 个 阶段 ， 有 哪些 情绪 变化 。 

用 户 旅行 地 图 的 制作 步骤 如 下 。 

(1) 定义 用 户 : 明确 指定 为 某 一 类 用 户 定义 用 户 旅行 地 图 。 
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(2) 定义 任务 或 阶段 : 在 这 些 任务 或 阶段 中 ， 会 有 哪些 不 同事 件 发 生 。 

(3) 用 户 与 服务 接触 点 的 互动 行为 : 在 不 同事 件 发 生 时 ， 用 户 如 何 操作 ， 操 作 顺 序 
如 何 。 

(4) 用 户 的 动机 : 用 户 在 每 个 操作 背后 会 产生 什么 样 的 想法 ， 有 什么 痛 点 。 

(5) 用 户 的 心理 : 在 每 个 操作 中 ， 用 户 心理 会 有 哪些 变化 ， 情 绪 会 如 何 起 伏 。 

当 将 其 操作 流 可 视 化 以 后 ， 捕 获 每 个 阶段 的 相关 信息 (如 操作 时 间 、 等 待 时 间 、 操 作 
次 数 等 数据 信息 )， 通 过 用 户 痛 点 发 现 其 中 可 能 存在 的 问题 ， 从 而 提出 相应 的 解决 方案 ， 
以 改善 最 初 的 业务 目标 。 这 些 解 决 方案 既 可 能 是 对 原 有 流程 的 全 面 改造 ， 也 可 能 是 对 某 个 
环节 的 局 部 优化 。 

例如 , 对 线 上 电 商 服务 来 说 , 一 个 重要 的 问题 领域 是 如 何 缩短 从 “用 户 开 始 查找 商品 ” 
到 “最 终 收取 货物 ”之 间 的 周期 。 针 对 这 个 问题 , 我们 可 以 通过 对 整个 流程 建 模 (如 图 2-8 
所 示 )， 对 流程 的 各 环 市 进行 分 析 (该 环 市 参与 的 角色 、 所 花费 时 间 及 成 本 )。 当 获得 问题 
症结 的 假设 后 ， 通 过 创建 新 的 流程 或 者 选择 一 些 环 节 进 行 方案 优化 ， 并 确定 量化 指示 器 。 



































图 2-8 ” 电 商 平台 的 业务 流程 示意 图 
对 电 商 平台 上 的 商家 服务 来 说 ， 假 如 电 商 平台 的 目标 是 “提升 商家 满意 度 "， 那 么 ， 














很 可 能 缩短 账 期 ， 商 家 就 会 对 平台 更 加 满意 ， 而 这 可 能 需要 对 原 有 的 财务 结算 系统 和 商家 
管理 系统 进行 改造 升级 。 

在 “ 共 创 "这 一 环节 中 ,需要 注意 两 个 陷阱 ,它们 分 别 是 :分 析 竣 痪 (paralysis by analysis ) 
和 直觉 决策 (extinct by instinct)。 分 析 瘫 痪 是 指 因 为 过 度 分 析 (或 过 度 思考 ) 而 无 法 决策 
或 采取 行动 ， 最 终 影响 结果 产 出 的 一 种 状态 。 通 常 是 由 于 有 太 多 的 细节 选项 , 或 者 过 于 寻 
求 最 佳 或 “完美 ”的 解决 方案 ， 并 担心 做 出 任何 可 能 导致 错误 结果 的 决定 。 而 直觉 决策 是 
指 不 做 分 析 ， 基 于 匆忙 的 判断 或 直觉 反应 而 做 出 致命 的 决定 。 它 是 与 分 析 瘫 病 相 反 的 另 一 
个 极端 。 

同时 , 值得 注意 的 是 , 很 多 解决 方案 产生 的 结果 是 相互 影响 和 关联 的 。 一 个 解决 方案 
可 能 会 影响 多 个 结果 指示 器 。 


2.2.4 ”精炼 


精炼 环节 就 是 对 共 创 环节 中 得 出 的 众多 方案 进行 评估 , 从 中 筛选 出 团队 认为 最 小 可 行 
性 解决 方案 的 过 程 。 评 估 因 素 包 括 备 选 方案 的 实施 成 本 、 时 间 与 人 力 、 效 果 反 馈 周 期 ， 以 
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及 该 方案 对 业务 目标 的 影响 程度 。 

在 YUCA 环 境 中 ， 时 间 是 最 大 的 隐形 成 本 。 如 果实 现 方案 所 需 时 间 太 多 ， 我 们 就 可 能 
错失 了 机 会 。 而 且 ， 某 些 方案 实施 以 后 ， 需 要 经 过 一 定 的 执行 周期 ， 才 能 看 到 它 带 来 的 真 
实效 果 ， 这 也 会 增加 时 间 成 本 。 我 们 希望 尽 可 能 多 地 选择 试验 方案 ， 因 为 每 个 方案 都 有 可 
能 有 助 于 解决 我 们 的 问题 ， 达 成 我 们 的 目标 。 

作为 一 个 电 商 网 站 ,Etsy 的 搜索 导航 条 在 2007 年 如 图 2-9 所 示 。 尽 管 当 时 并 没有 认为 这 
个 设计 是 永久 性 的 ， 但 直到 2012 年 ， 它 也 没有 发 生 很 大 的 变化 。 事 实 上 ， 大 多 数 买 家 并 不 
知道 怎么 用 它 。 例 如 ， 几 乎 根本 没有 人 使 用 其 中 的 搜索 项 “商店 ”(Shops) 。 
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Vintage 
Your place to busupplies 
All ltems People 
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图 2-9 ”Etsy 的 搜索 导航 条 


在 这 5 年 中 ,搜索 下 拉 框 上 已 经 增加 了 很 多 内 容 ， 承 担 了 过 多 的 职责 ， 而 且 并 不 是 所 
有 项 目 之 间 都 具有 直接 关联 性 。 因 此 ， 团 队 决 定 对 其 进行 大 改造 ， 于 是 专门 成 立 了 一 个 改 
造 项 目 。 团 队 成 员 提出 了 很 多 改造 的 想法 和 解决 方案 。 最 终 他 们 精炼 出 一 份 任务 清单 ， 如 
下 所 列 : 

(1) 重新 设计 页 面 上 的 搜索 区 ， 
默认 为 “所 有 项 目 ”，; 
更 丰富 的 自动 化 推荐 提示 ， 
在 搜索 结果 列表 中 给 出 推荐 的 商店 ; 
可 以 将 常用 过 滤器 加 入 搜索 收藏 夹 ， 
将 搜索 栏 分 别 放 到 商品 和 商店 页 面 上 ; 
7) 删除 原 有 的 搜索 下 拉 列 表 。 

其 中 ,每 一 项 任务 的 开发 时 间 都 很 短 ， 而 且 每 项 改造 任务 的 前 后 效果 都 可 衡量 , 并且 
任务 之 间 相 对 独立 。 在 改造 过 程 中 ， 每 当 完成 一 项 ， 都 可 以 进行 评估 ， 并 且 有 机 会 根据 每 
一 次 的 评估 结果 修订 原 有 的 项 目 执行 计划 ， 以 更 好 地 达到 业务 目标 。 


) 
) 
) 
) 
) 
) 
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在 上 述 精 炼 任 务 清单 中 ， 有 一 些 任务 是 成 功 的 ， 有 一 些 任 务 则 并 不 成 功 。 如 图 2-10 所 
示 ， 在 第 一 项 改造 〈 在 页 面 上 增加 一 个 商品 搜索 区 ) 后 ， 用 户 数据 显示 ， 几 乎 没有 用 户 注 
意 到 它 ， 而 在 第 三 项 改造 (增加 自动 化 推荐 ) 后 ， 数 据 效 果 则 比较 明显 。 











Weve made search better! Leam more about the improvements 
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scarf 


dachshund needle felt 


dil scarf in knitting ， scarf 


scarf in handmade 
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Ca) 新 增 的 商品 分 类 区 (Cb) 搜索 中 新 增 更 多 的 自动 提示 
图 2-10 ”Etsy 网 站 搜索 导航 的 两 个 优化 项 


因此 ， 我 们 不 难看 出 ， 即 使 是 一 项 巨大 的 改造 工程 ， 其 解决 方案 也 可 以 是 一 组 迷你 六 
案 的 集合 。 精 炼 的 目标 并 不 是 为 了 删除 在 共 创 阶段 得 出 的 解决 方案 ， 而 是 将 它们 按 优先 级 
排列 ， 并 让 团队 将 解决 方案 进一步 分 解 ， 顺 序 选 出 共同 认可 的 最 重要 改进 项 ， 并 确保 它 能 
够 尽早 被 验证 。 

通过 精炼 之 后 , 被 选择 的 方案 就 可 以 进入 验证 环 了 > 那么 如何 判 断 我 们 已 经 准备 好 ， 
可 以 进入 验证 环 了 呢 ? 一 个 简单 的 方式 就 是 你 能 够 将 探索 的 成 果 以 下 述 形式 表述 出 来 ,并 
且 达 成 团队 共识 : 


我 们 相信 ， 通 过 实现 (xxxxx 这 样 的 最 小 功能 组 合 )， 我 们 的 指标 可 以 达到 
(yyyyy 程 度 ) 的 话 ， 说 明 我 们 关于 (zzzzz ) 的 假设 是 成 立 的 。 








2.3 工作 原则 


为 了 能 够 加 快 探索 环 的 速度 ， 缩 短 整 个 “8” 字 环 的 运行 周期 ， 避 免 陷 和 “分析 瘫痪 ” 
的 境地 ， 在 探索 环 的 工作 中 应 该 遵循 "分 解 并 快速 试 错 ”“ 一 次 只 验证 一 点 “允许 失败 ” 
原则 。 

2.3.1 分 解 并 快速 试 错 

“一 次 到 位 式 ”解决 方案 通常 需要 较 高 的 实施 成 本 ， 而 其 带 来 的 实际 效果 具有 较 高 的 
不 确定 性 。 由 于 前 期 投入 的 成 本 较 高 ( 即 沉没 成 本 ) ， 一 旦 这 个 解决 方案 未 能 带 来 预期 效 
果 , 团队 不 愿意 放弃 这 一 方案 , 决策 者 通常 选择 保留 它 , 或 者 仍 会 持续 优化 , 使 其 慢 慢 “ 死 
去 "， 而 这 会 带 来 不 必要 的 产品 复杂 度 和 维护 成 本 。 
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如 果 我 们 能 够 换 一 种 思路 ， 更 多 地 使 用 低 成 本 快速 试验 方式 ， 那 么 在 相同 的 成 本 下 ， 
可 以 党 试 更 多 的 方法 , 能 够 尝试 更 多 的 次 数 , 意味 着 可 能 会 有 更 多 的 收益 。 如 图 2-11 所 示 ， 
在 相同 的 成 本 下 ， 尽 管 快 试 错 失败 次 数 多 ， 但 可 能 会 得 到 更 多 成 功 的 想法 。 


[TFT TH 


图 2-11 ” 慢 失 败 与 快 试 错 




















2.3.2 一 次 只 验证 一 点 


一 次 只 验证 一 个 需求 假设 。 在 执行 整个 试验 方案 过 程 中 ,我们 仍旧 要 保持 开放 心态 ， 
不 断 优化 这 些 试验 方案 。 时 刻 提 醒 自己 ,我 们 的 目标 是 验证 我 们 的 假设 ,试验 方案 只 是 我 
们 验证 假设 的 手段 ， 而 不 是 我 们 的 目标 。 

国外 电 商 Etsy 网 站 曾经 对 其 商品 的 搜索 结果 页 进行 彻底 地 大 改造 ， 将 商品 列表 的 展示 
效果 改 为 瀑布 流 式 ， 这 个 功能 类 似 于 百度 图 片 搜索 结果 页 的 无 限 下 拉 效 果 。 也 就 是 说 ， 当 
返回 多 于 一 页 的 商品 结果 时 ， 所 有 商品 可 以 依据 一 定 的 排序 规则 形成 一 个 瀑布 流 。 用 户 只 
要 向 下 清 动 页 面 ， 商 品 就 会 持续 不 断 地 展示 出 来 ， 直 到 所 有 搜索 结果 全 部 显示 出 来 。 

困 队 的 起 袖子 ， 问 头 干 了 好 长 时 间 ， 这 个 改造 终于 可 以 与 用 户 见 面 了 。 襄 慎 起 见 ， 他 
们 做 了 一 个 A/B 试 验 ， 结 果 令 他 们 大 吃 一 惊 。 因 为 在 瀑布 流 的 “实验 组 ”中 ， 有 连续 浏览 
行为 的 人 数 是 40， 而 在 “对 照 组 ”中 ， 这 一 人 数 为 80， 其 数据 如 图 2-12 所 示 。 商 品 点 击 率 
下 降 了 约 10%， 购 买 率 下 降 了 约 22.5%， 物 品 收藏 率 下 降 了 约 8%。 这 个 “瀑布 流 ” 根 本 没 
有 达到 预期 的 效果 ， 反 而 更 糟糕 。 
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图 2-12 ”瀑布 流 搜 索 页 的 试验 结果 
(资料 来 源 : 2012 年 Dan McKinley 和 的 “Design for Continuous Experimentation”) 


当 刚 刚 得 到 这 样 的 结果 时 , 团队 所 有 人 都 认为 一 定 是 软件 中 存在 缺陷 , 才 会 导致 这 个 
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结果 。 于 是 ， 团 队 进 行 了 各 种 排查 ,例如 将 用 户 按 浏览 器 和 地 理 位 置 进 行 分 片 。 派 人 到 公 
共 图 书馆 使 用 古老 的 计算 机 登录 网 站 。 团 队 确 实 发 现 了 一 些 软 件 缺 陷 , 但 修复 它们 后 也 没 
有 改变 整体 结果 。 

大 家 又 怀 疑 是 因为 不 同 浏览 器 的 体验 不 同 , 就 针对 不 同 的 浏览 器 进行 优化 。 每 个 优化 
在 不 同 的 浏览 器 上 表现 不 一 致 。 能 够 想到 的 优化 都 改 完 以 后 ， 情 况 也 没有 什么 好 转 。 最 终 
团队 接受 了 这 样 一 个 事实 ， 即 瀑布 流 方式 让 产品 变 得 更 糟 。 在 这 个 过 程 中 ， 团 队 一 次 性 改 
变 了 太 多 的 东西 ， 很 难 发 现任 何 线索 ， 找 出 “罪魁 祸首 ”。 

事实 上 ， 如 果 仔 细 分 析 ， 我 们 会 发 现 ， 在 “瀑布 流 ”这 个 功能 背后 的 假设 是 : 更 快 地 
为 用 户 展示 更 多 的 商品 ,会 让 用 户 的 购物 体验 更 好 ， 用 户 会 购买 更 多 的 商品 。 而 这 个 假设 
由 两 部 分 组 成 ,分别 是 (1) 显示 越 多 的 搜索 结果 给 用 户 ， 页 面 的 转化 率 指 标 越 好 ，(2) 
用 户 越 快 地 看 到 商品 ， 页 面 的 转化 率 指标 越 好 。 

事实 上 , 我 们 可 以 找到 更 快速 的 验证 方法 来 检验 这 两 个 假设 。 对 于 第 一 个 假设 ,在 现 
有 页 面 上 展示 出 当前 显示 数量 两 倍 的 商品 数量 ,看 是 否 提高 了 详情 页 的 转化 率 。 这 个 验证 
方案 的 实现 成 本 应 该 比 原来 无 限 瀑布 流 的 设计 要 少 很 多 。 事 实 的 结论 是 : 浏览 商品 落地 页 
的 用 户 只 增加 了 一 点 点 ， 而 且 这 个 增加 量 也 不 稳定 而 在 商品 购买 转化 率 上 并 没有 变化 。 

对 于 第 二 个 假设 ， 可 能 会 稍 显 困难 。 因 为 在 原 有 性 能 的 前 提 下 ， 再 次 提升 商品 显示 速 
度 ， 可 能 是 一 个 更 大 的 技术 挑战 。 但 是 ， 我 们 可 以 反 其 道 而 行 之 ， 也 就 是 说 ， 人 为 地 在 页 
面 上 增加 延迟 时 间 (如 200 ms) ， 以 验证 用 户 的 购买 率 会 下 降 。” 当 然 ， 这 并 不 是 一 个 完美 
的 试验 方案 。 不 过 ， 只 要 做 好 小 流量 测试 ， 使 其 不 大 幅 影响 整个 网 站 的 收入 ， 作 为 对 “ 延 
迟 时 间 影 响 用 户 购买 行为 " 这 一 假设 的 验证 方法 , 还 是 可 以 接受 的 。 试验 的 最 终结 果 是 “对 
数据 没有 任何 影响 ”。 


2.3.3 ”允许 失败 


尽管 每 个 产品 经 理 都 希望 所 有 方案 都 获得 成 功 ， 但 是 我 们 却 无 法 保证 每 个 方案 都 会 获 
得 成 功 。 但是， 只 要 具有 开放 的 心态 , 我 们 就 可 以 从 所 有 方案 中 都 学 到 很 多 新 的 知识 ， 而 这 
些 收获 无 论 是 对 产品 今后 的 成 功 , 还 是 团队 人 员 的 能 力 提升 , 都 具有 非常 重要 的 作用 。 国 外 
著名 电 商 网 站 Etsy 曾 经 做 过 一 次 商品 详情 页 的 改版 ， 这 个 商品 详情 页 如 图 2-13 所 示 。 

为 了 促进 下 单 转化 率 , 产品 经 理 打算 重新 设计 商品 详情 页 。 他 先后 提供 了 14 个 试验 方 
案 ， 其 中 每 个 方案 的 改动 都 不 是 很 大 。 例 如 ， 将 价格 以 美元 显示 改 成 按 用 户 所 在 地 所 使 用 
的 货币 显示 ， 将 商品 图 片 放 在 网 页 的 右 侧 。 甚 他 方案 还 包含 字体 或 按钮 的 大 小 及 颜色 变化 
等 。 这 14 个 试验 的 最 终结 果 是 ， 每 个 方案 对 下 单 转化 率 都 没有 太 多 的 影响 ， 甚 至 有 一 些 方 
案 的 下 单 转化 率 还 有 所 下 降 。 然 而 ， 在 这 14 个 试验 过 程 中 ， 产品 团 队 获得 了 一 些 新 的 用 户 
认 知 ， 例 如 用 户 关注 哪些 要 素 ， 对 哪些 要 素 不 是 很 敏感 。 最 终 ， 在 这 些 试 验 的 基础 上 ， 该 
页 面 做 了 一 个 全 面 的 改版 ,而 这 个 版 本 的 结果 使 订单 转化 率 提升 显著 ,该 项 目 成 为 当年 该 
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joe Like this tem? Silent Clock Upgrade Add-On 
dd it to your fevorites 


tes to revisit it later. 


USD7.50 Ask a question 
| tan ab 
Quantity 
1 
Overview 





SILENT CLOCK UPGRADE 


Shipping & returns 
Made just for you. Ready to ship in 1-2 weeks. 
From Unlted States 


Description Free shipping to China 


his silent clock upgrade applies to ONE clock To upgrade multiple clocks, plesse 


No returns or exchanges 
antity you add to your cart, For example, to upgrade three clocks, add 
But please contact me if you have any problems with 





Your order 


My clocks by default ship with American-made, quartz clock mechanisms. Adding 
this to your order will upgrade it to a silent mechanism. Silent mechanisms have no Favorlte Add to 
ticking noise. 











图 2-13 ”商品 详情 页 
2.4 共 创 与 精炼 的 常用 方法 


价值 探索 环 的 使 用 前 提 是 团队 拥抱 “ 先 假设 后 开发 ”的 思考 方式 ， 能 够 识别 前 面 提 到 
的 3 类 假设 ， 即 问题 假设 、 人 群 假设 和 解决 方案 假设 。 当 然 ， 有 了 这 些 假设 以 后 ， 我 们 还 
需要 一 些 方法 能 够 快速 设计 与 实现 。 只 有 这 样 , 我 们 才能 以 最 快 的 速度 完成 价值 验证 闭环 。 
下 面 就 通过 示例 向 大 家 介绍 一 些 实用 的 方法 。 

2.4.1 装饰 窗 方法 

所 谓 装 饰 窗 方法 (Decorative Window) ， 就 是 指 为 新 功能 预 留 一 个 “入 口 ”， 让 用 户 能 
够 看 到 ， 但 实际 上 并 没有 真正 实现 其 功能 。 就 像 一 个 装饰 性 的 窗户 ， 如 图 2-14 所 示 。 这 是 
一 种 了 解 用 户 喜 好 的 方法 ， 其 目的 是 利用 最 小 成 本 ， 来 验证 用 户 是 否 喜欢 某 个 功能 ， 以 及 
其 紧迫 程度 ， 为 是 否 研发 后 续 更 全 面 的 解决 方案 提供 数据 支持 。 

国内 某 垂直 电 商 公司 在 2013 年 做 了 一 次 商户 平台 的 体验 改进 。 在 负责 商户 端 产品 的 产 
品 经 理 进行 的 用 户 访谈 中 ， 多 个 商户 提 及 账 期 问题 “ 竞 品 的 账 期 已 经 改 为 两 周 了 ， 而 我 们 
还 要 3 周 ”。 
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图 2-14 ”装饰 窗 方法 


产品 经 理 针对 用 户 的 这 个 抱 忽 ， 设 计 了 一 个 新 的 功能 “即刻 提现 ”， 即 商户 可 以 随时 
通过 商户 管理 系统 的 页 面 ， 点 击 “ 立 即 提现 ”的 按钮 ， 就 可 以 将 账户 上 的 钱 提 到 自己 的 银 
行 卡 中 。 

在 产品 经 理 看 来 ， 这 是 一 个 非常 简单 的 功能 ， 用 不 了 多 长 时 间 就 可 以 上 线 。 然 而 ， 经 
过 负责 商户 管理 系统 的 研发 团队 的 评估 ， 需 要 6 周 才 能 圭 线 ;而 且 有 一 个 前 提 ， 那 就 是 需 
要 负责 财务 系统 的 开发 团队 积极 配合 对 接 才 行 。 习 听 需 要 6 周 ， 产 品 经 理 一 脸 的 不 高 兴 ， 
但 仔细 想 想 ， 也 知道 没有 想象 的 那么 简单 。 原 因 有 以 下 小 个 3 

(1) 商户 端 开 发 团队 本 身 还 有 其 他 功能 需求 正在 开发 中 元 只 有 这 些 需 求 做 完 之 后 才能 
开始 做 这 个 需求 。 

(2) 需要 负责 财务 系统 的 研发 团队 一 起 修改 现 有 的 财务 流程 。 

(3) 即使 全 部 开发 完了 , 也 要 一 起 进行 联 调 , 再 经 过 测试 团队 的 测试 , 才能 正式 上 线 。 

用 户 到 底 是 否 喜 欢 这 个 功能 ， 它 是 雪中送炭 还 是 锦上添花 ， 在 没有 真实 的 用 户 反 馈 前 ， 
这 是 个 未 知 数 。 能 否 快速 找到 答案 呢 ? 于 是 , 产品 经 理 与 开发 工程 师 一 起 想到 了 装饰 窗 方 法 。 

团队 在 商户 结算 详情 页 上 提供 了 一 个 可 点 击 的 按钮 。 当 用 户 点 击 以 后 , 会 弹出 一 个 页 
面 ， 给 出 一 段 文字 说 明 ， 如 图 2-15 所 示 ， 大 意 是 : 假如 商户 对 这 个 功能 感 兴趣 ， 可 以 留 下 
自己 的 联系 手机 号 ， 一旦 功能 开通 ， 即 可 立即 收 到 通知 。 

















我 要 提 款 


您 尚未 开通 此 功能 。 如 有 需求 ， 


商户 XXX， 


待 结算 金额 : 12324.28 元 * 请 留 下 您 的 手机 号 码 : 


137xxxx4568 








图 2-15 ”装饰 窗 页 面 设计 
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这 个 功能 所 需 的 开发 工作 量 如 下 所 列 。 

(1) 对 原 有 页 面 1 进行 修改 ， 增 加 一 个 按钮 “立即 提现 ”。 

(2) 增加 功能 说 明 页 面 2。 

(3) 用 户 提交 后 ， 保 存 手机 号 码 。 

此 时 ， 需 要 验证 的 假设 可 以 描述 为 :“ 我 们 相信 ， 在 没有 强烈 提示 用 户 的 前 提 下 ， 假 
如 在 一 周 内 收集 到 800 个 商户 的 电话 号 码 ， 则 说 明 有 较 多 的 商户 对 这 个 功能 感 兴趣 ， 我 们 
可 以 开始 进行 下 一 步 验证 。 
事实 上 ， 这 个 “装饰 窗 ” 功 能 发 布 以 后 ， 并 没有 广 而 告 之 ， 而 是 依赖 自然 流量 。 几 天 
后 ， 收 集 到 了 1000 多 个 手机 号 码 ， 而 且 ， 重 复 登 记 两 次 以 上 的 手机 号 码 一 共有 120 个 ， 似 
乎 这 个 功能 很 吸引 用 户 。 产 品 经 理 很 兴奋 ， 花 费 这 么 少 的 资源 和 时 间 ， 就 获得 了 用 户 的 反 
馈 ， 还 是 非常 值得 的 。 

2.4.2 ”最 小 可 行 特性 法 

最 小 可 行 特性 法 (Minimum Viable Feature) 是 指 在 产品 从 1 到 n 的 过 程 中 ,寻找 用 户 可 
直接 感知 到 的 需求 假设 作为 产品 的 最 小 可 行 特 性 优先 开发 的 方法 , 以 尽 可 能 少 的 成 本 快速 
增加 或 修改 某 个 产品 特性 ， 让 用 户 使 用 ， 收 集 真实 反馈 ， 专 注 于 验证 功能 改进 ， 同 时 也 可 
提升 用 户 使 用 体验 。 

此 时 ， 等 待 验证 的 假设 是 :“ 我 们 相信 ， 如 果 在 两 周 内 ， 那 些 多 次 预 留 手机 号 码 的 120 
个 商户 中 ， 有 60 个 商户 使 用 该 功能 ， 则 说 明 商 户 的 这 一 诉求 的 确 强烈 ， 该 功能 能 够 大 大 提 
高 商户 满意 度 ， 可 以 进一步 开发 全 自动 化 流程 。” 

团队 并 没有 实现 原 方案 中 的 全 部 功能 , 而 仅仅 开发 了 用 户 可 直接 感知 到 的 那 部 分 ， 如 
图 2-16 所 示 。 从 用 户 的 角度 看 ， 这 个 功能 的 确 完成 了 。 

















i 功能 开通 确认 
ER ey 开通 条 款 : 功能 开通 后 ， 将 暂停 自动 打 款 
立即 提现 > 结算 金额 12324.28 元 © 着 需要 恢复 自动 打 识 功能 ， 请 联系 客服 热线 ooooocx 


至 昨日 23:59:59 期 间 ， > 提 款 金额 12324.28 元 


算 的 金额 。 
~ 


本 提现 金额 以 财务 审核 后 的 数据 为 准 。 收 藉 赚 户 : xpooocx wooc oxx 到 三 日 期 ， 3 个 工作 日 内 


















口 我 确认 开通 立即 提现 条 款 
提现 记录 
申请 时 间 申请 金额 状态 
页 面 1 页 面 2 


图 2-16 ”用户 的 最 小 可 行 特性 


然而 ， 对 企业 内 部 来 说 ， 这 只 是 一 个 非常 简陋 的 版 本 。 当 用 户 确定 提现 申请 后 ， 后 台 
服务 会 发 送 一 封 邮件 给 团队 的 指定 人 员 ， 邮 件 中 包含 结算 提现 所 需要 的 必要 信息 。 该 负责 
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人 需要 打印 该 信息 ， 到 财务 人 员 那 里 手工 走 完 账 务 流程 ， 完 成 整个 交易 过 程 。 用 户 如 果 想 
要 取消 这 个 功能 的 话 ， 需 要 通过 客服 热线 申请 ， 而 无 法 自助 完成 。 因 此 ， 这 其 实 是 该 特性 
的 一 个 最 小 功能 集 。 因 为 这 一 最 小 功能 集 易 于 在 短 时 间 内 、 投 入 较 少 的 人 力 来 实现 ， 根 本 
没有 涉及 财务 管理 系统 的 开发 工作 。 

对 开发 团队 来 说 ， 可 以 在 最 短 时 间 内 收集 数据 ， 验 证 用 户 是 否 喜欢 该 功能 ， 再 决定 是 
否 还 要 继续 开发 后 续 的 功能 ， 对 用 户 来 说 ， 平 台 在 短 时 间 内 实现 了 立即 提现 的 需求 ， 提 升 
了 用 户 体验 。 这 样 ， 形 成 了 可 进 可 退 的 双赢 局 面 。 


2.4.3 特区 法 


特区 法 (Special Zone) 是 指 在 特定 用 户 范 围 内 进行 试验 ， 以 验证 某 个 新 功能 的 有 效 
性 。 这 样 ， 即 使 新 功能 无 效 或 者 效果 不 好 ， 也 不 会 影响 特区 外 的 用 户 。 这 种 方法 对 于 资源 
有 限 、 成 本 敏感 ， 但 仍 希 望 为 用 户 提供 良好 服务 的 业务 来 说 ， 是 非常 有 效 的 方法 。 大 家 所 
熟知 的 共享 汽车 和 共享 单车 ， 都 曾 采 用 这 种 方法 ， 也 就 是 说 ， 从 某 个 城市 或 菜 个 区 域 开始 
提供 服务 ， 试 图 回答 “该 需求 是 否 真实 存在 ?该 需求 是 否 强烈 ? ”这 类 的 问题 。 

在 “立即 提现 ”案例 应 用 了 “装饰 窗 方 法 ”以 后 ， 团 队 将 重复 录入 多 次 的 120 个 商户 
作为 “特区 用 户 ”， 向 他 们 发 送 手机 短信 ， 通 知 该 功能 已 经 下 线 。 当 天 下 午 就 有 第 一 个 商 
户 申请 立即 提现 。 在 之 后 两 天 里 ， 申 请 商家 并 没有 想象 的 那 终 踊跃 。 于 是 ,运营 人 员 向 这 
120 个 商户 再 次 发 送 了 短信 通知 ， 还 同时 发 送 了 一 条 商户 站 内 通知 。 

该 功能 上 线 两 周 后 ， 得 到 的 结果 是 : 只 有 45 个 商户 在 此 期 间 点 击 过 第 一 个 页 面 的 “ 申 
请 提现 ”按钮 , 真正 完成 提现 操作 的 商户 也 只 有 33 个 。 其中, 仅 提 取 一 次 的 商户 数 为 25 个 ， 
提取 两 次 的 商户 数 为 7 个 。 只 有 1 个 商户 提取 了 8 次 。 比 团队 预计 的 目标 50% 的 商户 ) 少 了 
很 多 ， 并 没有 达到 预期 。 产 品 经 理想 知道 原因 ， 于 是 采用 了 下 面 的 “定向 探索 法 ”。 


2.4.4 定向 探索 法 


定向 探索 法 (Directional Explorer) 是 指针 对 具有 某 种 特定 行为 的 特定 用 户 群体 ， 依 
据 访 用户 的 具体 行为 模式 ,设计 调查 提纲 ， 有 针对 性 地 探索 其 行为 背后 的 动机 。 这 种 定向 
探索 法 与 一 般 用 户 访 谈 的 不 同 点 在 于 : 团队 已 经 掌握 了 被 访谈 对 象 的 具体 行为 《包括 行为 
细 市 与 发 生 时 间 等 )， 以 事实 为 依据 ， 进 行 定向 式 的 探索 发 现 ， 而 非 宽 泛 的 通用 提问 。 

针对 用 户 不 同 的 行为 ， 团 队 将 用 户 进行 了 定向 分 类 。 例 如 : 

(1) 收 到 了 通知 ， 但 没有 进行 操作 的 用 户 ， 

(2) 访问 了 页 面 ,但 是 没有 进行 申请 确认 操作 的 用 户 ， 

(3) 申请 过 一 次 的 用 户 ， 

(4) 申请 超过 一 次 的 用 户 。 

针对 这 些 不 同 的 用 户 ,设计 不 同 的 问卷 ,进行 用 户 访 谈 ， 以 便 理解 用 户 行为 ， 为 后 续 
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的 服务 提供 有 效 的 输入 。 

最 终 ， 团 队 得 出 的 结论 是 : 该 功能 属于 锦上添花 的 功能 ， 可 以 解决 少量 商户 的 诉求 。 
另外 ,通过 定向 探索 ,团队 还 深入 发 现 了 两 个 新 的 用 户 痛 点 ， 为 进一步 提升 用 户 体验 提供 
了 改进 方向 。 

2.4.5 稻草 人 法 

稻草 人 法 (Com Dolly) 就 是 指 : 不 开发 任何 真实 的 功能 ， 只 假装 这 个 功能 已 经 完成 
了 ， 并 向 用 户 展示 该 功能 的 真实 效果 ， 从 而 得 到 用 户 的 真实 反馈 。 这 种 方法 与 装饰 窗 方法 
的 区 别 在 于 它 让 用 户 真实 地 感受 到 了 功能 提供 的 结果 ， 而 事实 上 并 没有 开发 这 个 功能 。 

这 种 方法 早 在 20 世 纪 80 年 代 的 IBM 公 司 就 使 用 过 。 当 时 ， 大 多 数 人 不 会 打字 ， 只 有 程 
序 员 、 秘书 和 作家 才 会 使 用 打字 机 和 计算 机 。IBM 公 司 很 希望 个 人 计算 机 能 够 被 广泛 使 用 ， 
于 是 其 市 场 部 门 就 做 了 市 场 需求 调研 。 在 调研 之 后 ， 市 场 部 强烈 认为 ,假如 IBM 公 司 能 够 
发 明 一 种 技术 ， 可 以 将 语音 直接 翻译 成 文字 并 自动 录入 计算 机 ， 不 需要 手工 打字 ， 那 么 会 
有 很 多 人 购买 这 种 计算 机 ， 即 使 售 价 高 达 一 万 美元 。 但 这 一 技术 的 研发 需要 投入 相当 大 的 
成 本 。 于 是 ， 有 人 提出 是 否 可 以 做 个 小 型 试验 来 验证 一 下 :“ 人 们 是 否 会 花 一 万 美元 购买 
这 种 具有 语音 输入 能 力 的 计算 机 ”， 其 试验 方案 如 图 2-17 所 示 。 























图 2-17 IBM 公 司 的 人 工 智 能 翻译 试验 








首先 在 一 个 房间 中 有 一 只 考 克 风 , 直接 连接 到 一 个 显示 屏 上 。 邀 请 那些 潜在 购买 者 来 
体验 这 一 技术 成 果 。 试 验 者 进入 这 个 房间 后 被 告知 ， 只 要 对 着 麦克 风 说 话 ， 所 说 的 内 容 就 
会 被 自动 翻译 出 来 ， 显 示 到 屏幕 上 。 事 实 上 ， 这 并 不 是 机 器 自动 翻译 的 。 在 另 一 房间 中 ， 
一 个 打字 速度 飞快 的 打字 员 边 听 边 打出 来 ， 传 到 试验 者 的 屏幕 上 。 这 个 打字 员 被 要 求 不 要 
漏 掉 任 何 信息 ， 例 如 试验 者 的 一 些 口 头 语 、 衔 接 停顿 音 等。 试验 结果 也 许 你 已 经 猜 到 了 ， 
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在 那个 年 代 ， 没 有 人 真 想 花 一 万 美元 购买 这 样 一 种 打字 机 器 。 
2.4.6 ”最 小 可 行 产 品 法 

最 小 可 行 产 品 法 (Minimum Viable Product) 通常 是 在 产品 从 0 到 1 的 过 程 中 使 用 。 它 是 
以 尽 可 能 少 的 成 本 快速 开发 产品 的 核心 功能 ， 并 找到 用 户 ， 收 集 真 实 反 馈 ， 验 证 真实 的 用 
户 需求 ， 以 确定 新 产品 方向 和 形态 的 方法 ， 其 目标 是 找到 合适 的 产品 形态 。 

国外 垂直 品类 电 商 平台 Zappos 最 早 根本 没有 自己 的 物流 管理 系统 ， 创 始 人 尼克 斯 威 
姆 (Nick Swinmurn) 和 谢 家 华 只 是 搭建 了 一 个 简单 的 图 片 展示 网 站 ， 并 跑 到 隔壁 鞋 店 拍 
报 一 批 鞋 子 的 照片 放 在 这 个 网 站 上 。 当 有 人 下 单 时 ， 他 们 就 去 那个 鞋 店 把 鞋 买 回来 ,然后 
手工 发 货 。 

这 就 是 使 用 最 简单 的 方式 来 验证 最 初 的 业务 想法 ， 而 不 是 先 建立 软件 开发 团队 ,构建 
一 个 完备 的 软件 支撑 系统 。 


2.5 ”实施 注意 事项 


为 了 更 好 地 执行 价值 探索 ， 在 整个 过 程 中 有 以 不 6 点 值得 注意 。 

1. 多 角色 参与 探索 

探索 环 涉 及 业务 领域 的 很 多 方面 ， 包 括 问 题 的 发 现 与 定义 、 目 标 与 衡量 的 制订 等 
多 种 产物 ， 而 不 仅仅 是 产 出 一 个 功能 需求 列表 。 因 此 ;建议 与 业务 领域 问题 及 产品 解决 
方案 相关 的 各 类 角色 都 能 够 参与 其 中 。 而且, 参与 其 中 的 每 个 人 均 应 该 对 上 述 内 容 有 所 
贡献 。 

“即时 提现 ”案例 就 是 由 团队 多 个 角色 共同 贡献 ， 使 得 方案 从 “大 而 全 的 一 次 到 位 式 ” 
转变 到 “分 步 快速 试验 式 "。 当 开发 工程 师 了 解 产 品 经 理 的 原始 想法 以 后 ， 从 不 同 的 视角 
分 解 问题 ， 并 一 起 集思广益 ， 得 出 了 这 种 投入 回报 率 最 高 的 最 简 方案 ， 以 较 少 的 资源 投入 
(只 需 一 人 做 技术 实现 ， 其 他 开发 人 员 还 在 开发 其 他 功能 ) ， 最 快 地 得 到 了 问题 的 答案 。 从 
第 一 步 的 “装饰 窗 ”， 到 最 后 一 步 的 “定向 探索 "， 前 后 也 只 用 了 大 约 6 周 ， 就 得 到 了 最 终 
的 结论 。 

正 像 敏捷 大 师 、Scrum 方 法 的 倡导 者 Mike Cohn 所 说 :“ 你 的 整个 产品 Backlog (需求 
列表 ) 不 必 全 部 来 自 Product Owner (产品 总 负责 人 或 产品 经 理 )。 当 团队 其 他 人 对 它 也 
做 出 贡献 时 ， 是 团队 参与 感 进入 良好 状态 的 一 种 信号 ， 此 时 团队 更 可 能 成 功 地 做 出 敏捷 
转型 。” 

2. 存在 往复 过 程 

探索 过 程 中 存在 很 多 的 不 确定 性 ， 因 此 4 个 环节 中 也 必然 存在 一 定 的 反复 与 循环 。 这 
是 正常 现象 ,尤其 是 当 业 务 领域 比较 复杂 、 涉 及 环节 比较 多 ， 业 务 流程 中 所 涉及 的 角色 也 
比较 多 时 ， 更 容易 发 生 。 很 可 能 在 讨论 某 个 问题 的 可 行 解决 方案 时 ， 会 发 现 另 一 个 隐藏 的 
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重要 业务 问题 。 

另外 ， 探 索 过 程 强调 “度量 与 量化 ”。 在 讨论 过 程 中 经 常会 出 现 对 衡量 指示 器 及 量化 
结果 理解 不 一 致 的 现象 ， 很 可 能 会 对 原来 达成 一 致 的 指标 项 产生 异议 。 这 是 值得 高 兴 的 事 
情 ， 因 为 我 们 发 现 了 在 日 常 沟通 中 不 易 被 发 现 的 理解 偏差 。 对 于 这 些 偏差 的 处 理 ， 参 与 探 
索 者 既 可 以 先 把 它 记录 下 来 ， 后 续 再 进行 探索 ， 也 可 以 将 当前 讨论 的 结果 记录 下 来 ， 并 针 
对 这 一 新 问题 开启 探索 之 旅 ， 甚 至 将 探索 者 分 成 两 组 ， 分 别 探讨 ， 再 进行 同步 。 无 论 遇 到 
哪 种 异议 ， 采 取 哪 种 行动 ， 参 与 探索 的 人 都 应 该 对 行动 达成 共识 。 

3. 风险 不 是 等 价 的 

我 们 会 从 每 个 业务 问题 中 分 析出 很 多 风险 或 假设 , 假如 我 们 为 每 个 假设 都 设计 出 多 种 
试验 方案 , 并 且 坚 持 实施 所 有 试验 方案 的 话 , 很 可 能 会 消耗 太 多 的 成 本 , 并 错过 市 场 时 机 。 
因此 ,我 们 仅 需 对 那些 被 评估 为 风险 较 大 的 假设 进行 验证 方案 设计 ， 并 尽量 以 较 低 成 本 进 
行 验证 。 而 对 于 那些 低 风险 项 ， 团 队 要 在 设计 解决 方案 时 ， 提 出 一 些 衡量 指标 器 ， 并 在 方 
案 执行 后 ， 一 同 收集 相关 的 数据 结果 。 

4. 上 帝 视角 

由 于 在 某 个 领域 工作 时 间 较 长 ， 有些 人 认为 自己 非常 了 解 用 户 ， 常 常 “ 闭 门 造 车 并 
美 其 名 日 “注重 用 户 体验 ”。 然 而 ， 当 产品 上 线 后 却 发 现 ， 用 户 对 产品 功能 有 很 大 的 意见 。 

2017 年 ， 某 互联 网 公司 的 人 工 智 能 部 门 收集 了 大 量 不 同类 型 的 数据 ， 需 要 进行 标注 。 
由 于 需要 标注 的 数据 类 型 较 多 , 不同 数据 类 型 的 标注 方法 不 同 ， 因 此 对 标注 者 的 技能 要 求 
也 有 所 不 同 。 该 公司 原来 招募 标注 人 员 的 工作 是 通过 线 下 考试 的 方式 ， 即 以 文件 的 方式 通 
过 邮件 将 材料 发 送 给 应 聘 者 ， 应 聘 者 完成 后 ， 再 邮件 回复 。 这 一 工作 由 数据 运营 人 员 和 数 
据 顾问 负责 ， 他 们 制订 了 标注 人 员 招 聘 的 整个 线 下 流程 和 规则 。 

但 是 ， 由 于 标注 需求 量 越 来 越 大 ,而 标注 人 员 的 流动 性 也 较 大 ， 因 此 ,标注 人 数 的 缺 
口 持续 扩大 ， 使 用 线 下 考试 方式 已 经 不 能 满足 对 标注 人 数 的 需求 。 经 过 讨论 ， 公 司 决定 组 
组 一 个 产品 开发 团队 ， 开 发 一 个 标注 人 员 在 线 考试 系统 ， 代 替 原 有 的 线 下 手工 考试 方式 ， 
提高 标注 人 员 招 聘 环 节 的 效率 。 产 品 开发 团队 的 产品 经 理 通过 向 数据 运营 人 员 和 数据 顾问 
了 解 业 务 领域 知识 和 业务 需求 , 分 析 并 撰写 了 在 线 考试 系统 的 需求 说 明 书 。 产 品 经 理 认 为 ， 
数据 标注 人 员 招 聘 工 作 已 经 通过 线 下 操作 方式 进行 了 一 段 时 间 , 数据 顾问 对 该 系统 的 软件 
需求 足够 明确 ， 从 数据 顾问 那里 了 解 的 业务 需求 应 该 足够 充分 ， 因 此 直接 设计 了 一 整套 的 
用 户 交互 界面 ， 该 系统 包括 题库 、 设 计 试卷 、 举 办 考试 、 收 集 试 卷 、 评 分 等 功能 ， 涉 及 出 
题 人 、 出 卷 人 、 答 卷 人 和 管理 员 4 个 角色 。 

当 该 系统 的 第 一 个 版 本 开发 完成 后 , 产品 经 理 找 来 了 数据 运营 人 员 和 数据 顾问 进行 系 
统 验收 。 验 收 通过 以 后 ， 就 马上 开始 灰 度 测试 。 灰 度 测 试 第 一 天 ， 就 收 到 了 答卷 人 的 大 量 
反馈 (吐槽 ) ， 系 统 的 很 多 功能 都 不 是 很 方便 。 
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从 在 线 考 试 系统 这 个 想法 的 产生 ， 到 第 一 次 灰 度 上 线 ， 时 间 跨 度 近 5 个 月 。 在 复 盘 时 ， 
这 个 项 目 团队 一 致 认为 有 两 个 严重 的 失误 ， 它 们 是 : 

(1) 团队 成 员 自 认为 已 经 掌握 了 答卷 人 的 所 有 需求 ， 因 此 直到 所 有 的 产品 开发 工作 都 
完成 ， 产 品 流程 的 设计 者 也 没有 找 该 系统 真正 的 使 用 者 进行 验证 。 

(2) 团队 认为 完全 有 能 力 开发 一 个 满意 的 在 线 考 试 系统 ， 因 此 根本 没有 考虑 先 设计 一 
个 最 小 可 发 布 版 本 (MVP)， 而 是 直接 设计 了 一 个 “大 而 全 ”的 版 本 ， 开 发 时 间 较 长 。 

之 后 ,团队 还 讨论 了 假如 重新 做 这 个 项 目 ， 团 队 会 如 何 做 ?经 过 热烈 讨论 ， 团队 找到 
了 很 多 可 行 方法 来 提前 验证 功能 需求 。 例 如 : 

(1)“ 纸 上 原型 交互 ”方法 ， 就 是 将 系统 交互 原型 打印 到 纸 上 ， 邀 请 用 户 试验 ， 观 察 
用 户 的 行为 , 并 与 用 户 沟通 ,从 而 得 到 用 户 反 馈 , 当然 现在 有 很 多 电子 工具 支持 这 种 需求 ; 

(2)“MVYP” 法 ， 即 快速 推出 “面向 标注 人 ”的 简化 考试 版 本 ， 仅 实现 其 中 一 种 类 型 
标注 的 在 线 考试 功能 ， 而 题库 以 及 出 题 人 相关 的 功能 均 暂时 先 由 内 部 人 员 用 手工 方式 进 
行 准备 。 

5， 唯 数字 论 

当 我 们 建立 起 数据 指标 体系 ,搭建 好 我 们 的 试验 机 制 ,- 并 且 能 够 收集 到 大 量 指标 数据 
以 后 ， 有 一 点 需要 格外 注意 ， 那 就 是 : 所 有 收集 到 的 数据 只 能 告诉 你 当前 的 状态 是 什么 ， 
并 不 能 直接 告诉 你 背后 的 原因 是 什么 ， 也 无 法 完全 预测 未 来 ; 允 其 当 业务 市 场 发 生 改变 ， 
而 数据 又 无 法 展示 时 。 

短视 频 移动 应 用 “快手 ”的 前 身 是 一 款 移 动 端 SIF 图 片 生成 工具 (名 为 “GIF 快 手 ”)， 
当时 用 户 规模 也 到 了 一 定数 量 (GIF 快 手 鼎 盛 时 拥有 几 千 万 用 户 ， 日 活跃 用 户 上 百 万 ， 但 
同时 也 有 工具 型 产品 的 弱点 : 留存 率 偏 低 ) 。2013 年 ， 它 转型 做 短视 频 应 用 ， 最 低 点 时 日 
活跃 用 户 跌落 至 万 级 ， 然 而 ， 现 在 日 活跃 用 户 近 亿 。 试 想 如 果 只 看 数据 ， 坚 持 做 GE 图 片 
生成 ， 是 否 还 能 有 现在 这 么 庞大 的 用 户 群 呢 ? 
因此 ， 拿 到 指标 数据 之 后 ， 我 们 仍旧 需要 仔细 思考 , 分 析 各 项 数据 背后 的 原因 ， 思 考 
未 来 的 发 展 趋势 ， 甚 至 提出 一 些 我 们 没有 完全 把 握 的 问题 或 方向 ， 再 次 开启 探索 环 。 

6. 蛇行 效应 

还 有 一 种 情况 ， 比 较 常见 。 团 队 针 对 问题 制订 了 一 系列 的 试验 方案 A， 并 开始 执行 验 
证 。 但 在 还 没有 执行 完成 或 得 到 结果 之 前 ， 团 队 又 有 了 新 的 想法 和 方案 B， 并 且 对 新 的 想 
法 兴奋 不 已 ， 马 上 开始 执行 方案 B。 没 有 和 多久， 可 能 又 想到 了 一 个 新 的 方向 ， 如 此 循环 ， 
如 图 2-18 所 示 。 

这 经 常 发 生 在 中 小 企业 因 资 金 到 位 而 人 员 快 速 膨 胀 的 时 候 。 既 可 能 是 因为 试验 方案 需 
要 较 长 的 时 间 ， 也 可 能 是 因为 管理 者 关注 的 问题 点 转变 得 过 快 。 我 们 无 法 排除 原来 打算 解 
决 的 业务 问题 已 经 失效 的 可 能 性 ， 但 这 种 情况 对 于 团队 的 管理 有 极 大 的 挑战 。 


































































































i 


et 


图 2-18 ”蛇行 效应 
2.6 ”小结 


本 章 讨论 了 持续 交付 “8” 字 形 环 之 探索 环 中 的 4 个 关键 环节 ， 包 括 提 问 、 锚 定 、 共 创 
和 精炼 。 希 望 顺利 实施 这 4 个 环节 ， 需 要 遵守 3 个 基本 实施 原则 ， 分 别 是 分 解 并 快速 试 错 、 
一 次 只 验证 一 点 和 人 允许 失败 。 

本 章 还 花 了 大 量 篇 幅 介绍 了 共 创 与 精炼 环节 中 经 常用 到 的 6 种 方法 ， 也 就 是 装饰 窗 方 
法 、 最 小 可 行 特性 法 、 特 区 法 、 定 向 探索 法 、 稻 草 人 法 和 最 小 可 行 产 品 法 。 这 6 种 方法 可 
以 帮助 团队 用 最 少 的 时 间 、 最 小 的 成 本 来 找 出 用 户 的 真实 需求 ， 避 免 最 终 的 产品 与 用 户 需 
求 的 偏差 ， 达 到 事半功倍 的 效果 。 

探索 环 中 的 最 小 可 行 方 案 , 对 价值 验证 的 速度 有 极 大 的 影响 。 希望 大 家 在 日 常 工作 中 
能 够 使 用 这 些 方法 ， 以 最 小 的 成 本 来 实现 更 多 的 价值 交付 。 
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ER 
住 的 最 重要 的 一 点 就 是 : 结果 只 存在 于 企业 的 外 部 …… 在 企业 的 内 部 ， 只 有 成 
本 。” 也 就 是 说 ， 在 我 们 创造 的 产品 或 服务 真正 被 用 户 使 用 之 前 ， 我 们 只 能 衡量 成 本 ， 预 
测 价值 。 只 有 产品 或 服务 被 用 户 消费 ， 并 且 最 终 能 够 变现 ， 才 能 证 明 其 价值 的 存在 。 

当 我 们 通过 “探索 环 ” 对 最 小 可 行 方案 达成 共识 以 后 , 要 借助 “验证 环 ” 的 快速 运转 ， 
才能 将 其 交付 到 用 户 (客户 ) 手中 ， 从 而 得 到 真实 且 可 靠 的 反馈 ， 以 验证 之 。 快 速 验证 环 
的 运转 速度 也 由 两 部 分 决定 : 一 是 探索 环 中 得 出 的 最 小 可 行 性 解决 方案 的 大 小 和 复杂 性 ， 
我 们 在 前 一 章 中 已 经 讨论 过 得 到 最 小 可 行 试验 方案 的 正 作 方法 ; 工 是 验证 环 自身 运转 的 速 
度 ， 这 是 本 章 讨论 的 重点 内 容 ， 如 图 3-1 所 示 。 
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图 3-1 ”持续 交付 之 验证 环 
3.1 验证 环 的 目标 
进入 验证 环 的 基本 前 提 是 “团队 已 达成 共识 ， 所 选 的 方案 是 当前 所 处 环境 下 ,验证 或 








解决 业务 领域 问题 的 最 佳 方式 ” 。 验 证 环 的 目标 就 是 借助 各 种 方法 与 工具 ， 让 质量 可 靠 的 
解决 方案 以 最 快 的 速度 到 达 客 户 手中 ， 从 而 收集 并 分 析 真实 的 反馈 。 


质量 与 速度 是 验证 环 的 关键 , 然而， 它们 却 常常 被 认为 是 互 斥 的 ， 也 就 是 说 ， 要 想 交 
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付 质 量 好 ， 那么 交付 速度 就 会 慢 ， 反 之 亦 然 。 然 而 ，Puppet Labs 发 布 的 2017 年 DevOps 现 状 
调查 报告 结果 显示 ， 与 低 绩 效 IT 组 织 相 比 ， 高 绩效 IT 组 织 可 以 同时 实现 这 两 个 目标 ， 也 就 
是 说 ,发 布 质量 好 而 且 频 率 高 。 持 续 交 付 1.0 在 这 方面 发 挥 了 巨大 作用 ， 如 质量 内 建 、 小 批 
量 交 付 、 自 动 化 一 切 重复 工作 等 。 


3.2 ”验证 环 的 4 个 关键 环节 


验证 环 的 主要 工作 内 容 就 是 以 最 可 靠 的 质量 和 最 快 的 速度 , 将 最 小 可 行 性 解决 方案 从 
描述 性 语言 转换 成 可 运行 的 软件 包 ， 并 将 其 部 署 到 生产 环境 中 运行 ， 准 确 收集 相关 数据 并 
呈现 ， 以 便 团队 根据 相关 数据 做 出 判断 和 决策 。 与 探索 环 一 样 ， 它 也 包含 4 个 环 市 ， 分 别 
是 构建 、 运 行 、 监 测 和 决策 。 

(1) 构建 : 是 指 根 据 非 数字 化 描述 ,将 解决 方案 准确 地 变 成 达到 质量 要 求 且 可 运行 的 
软件 包 。 

(2) 运行 : 是 指 将 达到 质量 要 求 的 软件 包 部 署 到 生产 环境 或 交 到 用 户 手中 ， 并 使 之 为 
用 户 提 供 服务 。 

(3) 监测 : 是 指 收集 生产 系统 中 产生 的 数据 ， 对 系统 进行 监控 ,确保 其 正常 运行 。 同 
时 将 业务 数据 以 适当 的 形式 及 时 呈现 出 来 。 

(4) 决策 : 是 指 将 收集 到 的 数据 信息 与 探索 环 得 出 的 对 应 目标 进行 对 比分 析 ， 做 出 决 
策 ， 确 定 下 一 步 的 方向 。 


3.2.1 构建 


构建 环节 是 将 自然 语言 的 描述 转换 成 计算 机 可 执行 的 软件 , 即 “质量 达标 的 软件 包 ”。 
这 一 环 市 既 要 求 相 关 人 员 能 对 业务 问题 及 试验 方案 达成 共识 , 又 要 求 能 够 准确 地 将 团队 的 
意图 转换 成 最 终 仅 由 0 和 1 组 成 的 数字 程序 。 

这 一 环节 的 参与 角色 最 多 , 尤其 当 开发 一 个 新 产品 或 者 产品 有 重大 变更 的 时 候 , 参与 
角色 如 业务 人 员 、 产 品 经 理 、 开 发 工程 师 和 调 斌 工程师， 以 及 运 维 工程 师 。 每 个 角色 的 背 
景 知 识 和 技能 优势 各 不 相同 ， 如何 快速 将 人 们 头脑 中 的 解决 方案 变 成 可 以 运行 的 高 质量 软 
件 包 ， 一 直 是 软件 工程 领域 的 一 个 难题 。 这 是 验证 环 内 不 确定 因素 最 多 的 一 个 环节 。 时 间 
盒 管理 、 工 作 任务 分 解 和 持续 验证 是 应 对 这 种 不 确定 性 的 好 方法 。 

1. 时 间 盒 管理 

时 间 盒 方法 (timeboxing) 是 一 种 常见 的 管理 方法 ,很 多 项 目 管理 方法 中 都 使 用 时 间 
盒 管 理 。 时 间 盒 方法 通常 会 涉及 交付 物 、 交付 质量 和 截止 时 间 。 通过 建立 时 间 盒 管理 机 制 ， 
可 以 了 解 当 前 的 项 目 状态 (进度 与 质量 )， 及 时 发 现 风险 ， 制 订 对 策 。 它 可 以 让 团队 时 刻 
关注 工作 产 出 ， 及 时 得 到 进度 和 质量 反馈 。 关 于 迭代 时 间 盒 的 管理 参见 第 6 章 。 
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2. 任务 分 解 

对 任务 的 分 解 是 “持续 交付 2.0” 的 核心 工作 原则 之 一 。 在 构建 环节 ， 常 见 的 两 种 任 
务 分 解 是 需求 拆 分 和 开发 任务 拆 分 。 

(1) 需求 拆 分 。 这 里 所 说 的 “需求 ”是 指 那些 由 探索 环 产 出 且 已 被 团队 选 定 即将 进入 
实施 阶段 的 最 小 可 行 性 解决 方案 ， 并 不 是 指 最 原始 的 业务 领域 需求 。 "需求 拆 分 ”是 指 通 
过 团队 讨论 ， 将 试验 方案 分 解 成 更 细 粒 度 的 子 需 求 的 过 程 ， 也 是 团队 成 员 进 一 步 达成 共识 
的 过 程 。 它 的 工作 产 出 物 是 更 细 粒 度 的 子 需求 ， 也 就 是 极限 编程 方法 中 的 用 户 故事 (user 
story) 或 者 Scrum 方 法 中 的 迭代 任务 项 (sprint backlog item)。 通 过 需求 拆 分 ， 团 队 各 角色 
互相 交流 和 提问 ， 使 解决 方案 更 加 明确 清晰 ， 减少 二 义 性 。 此 时 ， 可 以 将 “团队 是 否 达成 
共识 ”作为 需求 明确 与 否 的 标准 。 关 于 需求 拆 分 的 方法 参见 第 6 章 。 

(2) 开发 任务 拆 分 ， 即 为 了 实现 某 一 需求 ， 将 其 分 成 多 个 开发 任务 ， 这些 开发 任务 既 
可 以 由 一 人 完成 ， 也 可 能 由 多 人 完成 。 它 与 需求 拆 分 的 不 同 在 于 : 开发 任务 完成 后 ,通常 
无 法 被 其 他 角色 验收 。 这 一 过 程 也 是 一 个 需求 进一步 细 化 的 过 程 ， 可 以 发 现 更 细 粒 度 的 风 
险 项 。 

3. 持续 验证 

持续 验证 是 指 每 当 完成 一 项 开发 任务 或 需求 (包含 子 需 求 ) ， 就 立即 对 交付 质量 进行 
验证 ， 而 不 是 等 待 多 项 需求 完成 后 ， 再 进行 大 批量 的 质量 验证 工作 。 这 是 一 种 快速 反馈 机 
制 ， 也 就 是 说 ， 一 旦 完成 ， 即 有 反馈 。 例 如 ， 这 些 质 量 验证 工作 可 能 包括 代码 规范 检查 、 
代码 安全 扫描 ， 验 证 其 是 否 破坏 了 原 有 功能 、 是 否 满足 设计 需求 等 。 尽 管 此 时 的 工作 成 果 
还 没有 交 到 用 户 手中 ， 但 是 可 以 验证 其 是 否 达 到 了 内 部 质量 标准 。 

假如 所 有 的 持续 验证 工作 都 要 依赖 手工 执行 ,那么 持续 验证 就 会 产生 很 高 的 成 本 ， 而 
“持续 集成 ”与 “自动 化 测试 ”是 降低 持续 验证 成 本 的 一 种 有 效 手 段 。 持 续集 成 是 极限 编 
程 方法 中 的 一 个 实践 ， 现 在 已 被 业界 广泛 接受 。 它 是 指 开 发 人 员 完 成 一 个 开发 任务 后 ， 尽 
快 与 团队 其 他 人 的 代码 (或 者 系统 中 其 他 模块 的 功能 ) 集成 在 一 起 ， 并 验证 该 任务 完成 的 
质量 ， 其 中 质量 要 求 不 但 是 当前 的 开发 任务 质量 ， 还 要 确保 对 原 有 功能 没有 产生 破坏 。 只 
有 这 样 ， 开 发 人 员 才 可 以 尽早 地 得 到 代码 质量 反馈 ， 而 不 将 缺陷 遗留 到 下 游 工 作 环节 。 关 
于 持续 集成 更 多 的 细节 内 容 ， 参 见 第 9 章 。 

在 持续 集成 实践 中 ， 最 重要 的 质量 验证 手段 就 是 自动 化 测试 。 自 动 化 测试 的 覆盖 率 、 
执行 时 间 以 及 测试 结果 可 信 度 直接 影响 了 质量 反馈 自身 的 可 靠 性 和 可 信 度 , 是 不 可 忽视 的 
环节 。 关 于 如 何 建设 这 个 质量 保护 网 ， 参 见 第 8 章 。 


3.2.2 ”运行 
验证 环 的 第 二 个 环节 的 任务 就 是 将 软件 包 部 署 于 生产 环境 ， 并 让 它 对 外 提供 服务 。 每 
次 进行 新 版 本 软件 的 部 署 发 布 时 ， 我 们 都 不 希望 影响 用 户 的 正常 使 用 。 因 此 ， 如 何 让 用 户 
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在 无 感知 的 情况 下 完成 软件 版 本 的 升级 更 新 是 互联 网 时 代 最 为 重要 的 课题 。 即 便 是 最 传统 
的 金融 行业 也 在 不 断 寻找 更 优 的 解决 方案 ,在 保证 事务 安全 和 数据 一 致 性 的 前 提 下 ， 优 化 
用 户 体验 。 

这 一 环节 是 开发 团队 与 运 维 团 队 之 间 发 生 冲 突 最 多 的 环节 , 也 是 重复 性 手工 操作 最 多 
的 环节 之 一 。 在 这 一 方面 ， 团 队 应 该 不 遗 余力 地 进行 改进 和 优化 ， 将 人 从 重复 性 体力 劳动 
中 解放 出 来 。 
3.2.3 监测 


监测 环节 收集 数据 ， 并 统计 展现 结果 、 及 时 发 现 生产 系统 问题 以 及 业务 指标 的 异常 波 
动 ， 并 做 出 适当 的 反应 。 它 也 是 团队 做 出 决策 的 最 重要 数据 源 之 一 。 只 有 当 数 据 可 信 无 差 
错时 ， 团 队 才能 基于 它们 做 出 合理 的 分 析 和 判断 。 假 如 有 数据 丢失 或 者 误差 时 ， 团 队 很 可 
能 做 出 错误 的 决定 ， 与 商业 机 会 失之交臂 。 另 外 ， 为 了 能 够 及 时 发 现 生 产 环 境 的 稳定 性 问 
题 和 隐患 ， 快 速 收集 系统 运行 监控 数据 并 加 以 分 析 定 位 问题 也 是 必 不 可 少 的 。 

为 了 能 够 在 第 一 时 间 收 集 到 所 需 数据 , 团队 必须 在 验证 环 一 开始 就 讨论 并 确定 验证 所 
需 的 数据 需求 , 尽早 讨论 并 定义 数据 需求 规范 , 制订 日 志 记 录 标 准 , 建立 数据 日 志 元 数据 ， 
并 与 相对 应 的 功能 需求 一 并 同时 实现 。 否 则 即使 相应 的 功能 特性 上 线 ， 也 无 法 得 到 相应 的 
数据 而 耽误 决策 。 

3.2.4 决策 


决策 是 指 收 到 真实 的 业务 数据 反馈 结果 后 , 根据 探索 环 中 已 确定 的 相应 衡量 指标 进行 
对 比分 析 ， 从 而 验证 是 否 符合 最 初 的 预期 。 通 过 分 析 其 中 原因 ， 最 终 确 认 原 来 定义 的 那些 
需求 假设 是 否 成 立 ， 并 决定 是 否 坚 持原 有 的 产品 方向 ， 或 者 根据 得 到 的 信息 做 出 调整 。 此 
时 ， 下 一 步行 动 既 可 能 是 从 精炼 环节 的 最 小 可 行 方案 列表 中 选择 下 一 个 试验 方案 ,也 可 能 
是 返回 到 持续 交付 “8” 字 环 的 起 点 ， 开 始 新 问题 的 探索 。 


3.3 工作 原则 


验证 环 的 工作 原则 主要 包括 质量 内 建 、 消 除 等 待 、 尽 量 并 行 、 监 测 一 切 。 很 多 软件 开 
发 方法 已 为 我 们 提供 了 诸多 优秀 实践 ， 消 除了 其 中 的 浪费 。 然 而 ， 有 一 些 实践 可 能 会 超出 
团队 当前 的 能 力 ， 需 要 团队 管理 者 制订 相应 的 团队 能 力 提升 计划 。 


3.3.1 质量 内 建 


以 瀑布 开发 方法 为 代表 的 传统 软件 开发 方法 虽然 强调 每 个 阶段 的 输入 输出 质量 , 但 是 
在 项 目前 期 只 产 出 大 量 详 细 文 档 ， 却 没有 开发 出 可 以 运行 的 软件 。 直 到 进入 正式 的 集成 济 
试 阶段 ， 才 将 所 有 代码 模块 放 在 一 起 运行 起 来 。 这 种 做 法 导致 发 现 软件 问题 的 时 机 较 晚 ， 















































40 第 3 章 快速 验证 环 





缺陷 被 发 现 之 后 的 修复 成 本 也 比较 高 。《 代 码 大 全 2》 一 书 对 于 缺陷 产生 的 成 本 也 有 如 下 的 
表述 :“ 发 现 错误 的 时 间 要 尽 可 能 接近 引入 该 错误 的 时 间 。 缺 陷 在 软件 食物 链 里 面 待 的 时 
间 越 长 ， 对 食物 链 的 后 级 造成 的 损害 就 越 严重 。 由 于 需求 是 首先 要 完成 的 事情 ， 因 此 需求 
的 缺陷 就 有 可 能 在 系统 中 光伏 更 长 的 时 间 ， 代 价 也 更 加 昂贵 。 
从 表 3-1 中 给 出 的 引用 图 表 中 的 数据 可 以 看 出 “引入 缺陷 的 时 间 和 找到 缺陷 的 时 间 ” 
与 “修复 缺陷 成 本 ”之 间 成 倍数 关系 。 
表 3-1 缺陷 引入 阶段 、 发 现 阶段 与 修复 成 本 之 间 的 关系 














引入 缺陷 的 阶段 /检测 


到 缺陷 的 阶段 需求 阶段 架构 创建 阶段 | 系统 开发 阶段 | 系统 测试 阶段 发 布 之 后 











需求 1 3 5 一 10 10 10 一 100 
架构 = 1 10 15 25 一 100 
构建 三 ES 1 10 10~25 






































这 种 企图 通过 后 期 大 规模 检查 达成 软件 质量 目标 的 做 法 , 恰恰 与 戴 明 博士 的 质量 观点 
背道而驰 。 戴 明博 士 是 世界 著名 的 质量 管理 大 师 ， 他 提出 的 质量 管理 “十 四 要 点 ”是 全 面 
质量 管理 的 重要 理论 基础 。 其 中 的 第 三 要 点 如 下 : 























我 们 无 法 依靠 大 批量 的 检验 来 达到 质量 标准 3 依靠 检验 提高 质量 已 经 太 迷 了 ， 
且 成 本 高 而 效益 低 。 正 确 的 做 法 是 ， 从 生产 过 程 的 开始 之 处 ， 就 做 到 质量 内 建 。 








“质量 内 建 ”(built quality in) 就 是 从 生产 过 程 的 第 一 个 环节 开始 ， 就 要 注重 产 出 物 的 
质量 ， 并 且 在 每 个 环节 中 都 要 开展 质量 保障 活动 ， 消 除 因 质量 问题 导致 的 返工 及 次 品 率 上 
升 ， 以 此 降低 最 终 的 质量 风险 ， 保 障 进度 。 

3.3.2 ”消除 等 待 

在 第 1 章 中 ， 我 们 讨论 了 精益 思想 关于 “浪费 ”的 定义 ， 显然“ 等 待 ”就 是 一 种 不 必 
要 的 浪费 。 在 日 常 工作 中 ， 我 们 经 常会 遇 到 一 些 等 待 ， 而 这 些 等 待 已 司空 见 惯 ， 大 家 习 以 
为 常 。 然 而 ， 提 升 效 率 的 最 有 效 方法 也 许 就 是 消除 各 环 市 的 等 待 。 

1. 通过 “拉动 ”让 价值 流动 起 来 

当 管 理 者 把 重心 放 到 “人 ”的 效率 上 时 ， 就 容易 出 现 所 有 人 都 很 已 ， 但 产 出 并 没有 提 
升 的 情况 。 此 时 通常 会 出 现 中 间 产 物 堆积 等 待 现象 , 如 图 3-2 所 示 ， 由 于 下 游 环 市 的 产能 相 
对 不 足 ， 导 致 中 间 产 物流 动 不 畅 。 此 时 ， 很 可 能 所 有 人 都 在 满 负 衔 运 转 。 在 这 种 情况 下 ， 
假如 开发 人 员 继 续 开 发 更 多 的 需求 ， 则 对 团队 的 整体 产 出 并 没有 直接 帮助 ， 只 会 增加 测试 
环 市 的 压力 。 而 压力 过 载 后 ， 可 能 会 引发 更 多 的 问题 , 例如， 如果 开 发 人 员 在 质量 尚 不 确 
定 的 代码 上 继续 开发 更 多 的 功能 ， 就 可 能 导致 更 多 的 缺陷 。 要 想 解决 这 个 问题 ， 需 要 将 管 
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理 关 注 点 先 从 “人 ”移动 到 “ 物 ”。 


开发 中 等 待 测试 测试 中 








图 3-2” 因 下 游 处 理 能 力 不 足 导致 的 阻塞 


正确 的 做 法 应 该 是 扩大 “瓶颈 ”的 处 理 能 力 ,将 更 多 的 需求 交付 出 去 。 我 们 可 以 通过 
临时 增加 专职 测试 人 员 的 方式 ， 扩 大 测试 环 市 的 通行 能 力 。 然 而 ， 我们 很 难 通 过 增加 入 手 
的 方式 使 各 环 市 输入 与 产 出 保持 平衡 的 理想 状态 。 此 时 还 可 以 通过 “临时 减少 开发 人 力 ” 
的 方式 (将 团队 部 分 开发 人 手 或 其 他 角色 调整 到 测试 环节 ) 来 临时 扩大 测试 环节 的 能 
达到 整个 系统 的 最 大 化 产 出 。 第 15 章 将 讲述 的 实际 案例 中 ,就 使 用 了 这 种 手段 来 临时 提高 
测试 环节 的 处 理 能 力 ， 保 证 团队 的 产 出 。 

当然 ,这 是 一 个 临时 性 的 解决 方案 。 如 果 从 整个 系统 的 角度 出 发 ， 应 该 根据 下 游 的 生 
产能 力 来 确定 上 游 的 生产 速度 ， 即 下游 环 市 拉动 上 游 的 需求 ,如 图 3-3 所 示 。 一 旦 等 待 队列 
中 出 现 空 位 ， 立 即 从 上 游 填 补 ， 以 此 类 推 。 

开发 中 等 待 测试 测试 中 





























图 3-3 ”通过 下 游 拉动 方式 ， 让 价值 流动 起 来 


为 了 达到 这 样 的 流畅 效果 ， 需 要 将 需求 粒度 均匀 化 。 也 就 是 说 ， 在 构建 环节 ， 通 过 需 
求 分 解 方法 ， 将 大 需求 分 解 成 多 个 工作 量 相近 的 小 需求 ， 才 能 让 工作 变 得 平 请 顺畅 。 就 像 
在 高 速 公路 上 ， 当 只 有 小 轿车 时 ， 通 行 能 力 比较 容易 提升 ， 但 当 大 货车 与 小 轿车 混 行 时 ， 
道路 的 通行 能 力 就 会 下 降 。 

困 队 的 瓶颈 通常 都 是 动态 变化 的 。 即 使 我 们 做 了 需求 分 解 工 作 , 也 不 能 保证 在 任何 时 
刻 整个 系统 都 是 平 请 运行 的 。 我 们 还 有 另外 一 种 解决 方案 ， 那 就 是 : 利用 开发 环 市 暂时 过 
剩 的 人 力 来 建设 工具 平台 ， 提 升 下 游 的 基础 能 力 ， 使 得 在 不 增加 测试 人 力 的 情况 下 ， 永 入 
提升 团队 整体 产能 。 当 然 , 通过 提升 人 员 整 体 技能 水 平 也 能 达到 同样 的 目的 , 如 图 3-4 所 示 。 
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开发 中 等 待 测试 测试 中 ll 





图 3-4 开发 工具 、 提 升 能 力 或 增加 瓶颈 人 力 后 ， 整 体 吞 吐 量 提 升 


2. 任务 自助 化 

企业 应 该 在 工具 平台 建设 方面 改变 一 下 思路 ， 也 就 是 说 ， 通 过 运用 先进 的 生产 技术 ， 
使 得 环境 部 署 、 数 据 统计 这 一 类 事务 性 操作 不 再 依赖 “专家 型 ”人 才 ， 而 是 让 每 个 人 在 其 
需要 时 都 能 够 “自助 服务 "。 那 么 每 个 人 都 可 以 流畅 地 工作 ， 而 且 “ 专 家 型 ”人 才 被 “ 打 
断 工 作 ” 的 次 数 也 会 减少 。 

例如 ， 对 微服 务 架 构 的 软件 服务 来 说 ， 如 果 开 发 人 员 自 己 无 法 随时 搭建 一 套用 于 微服 
务 开发 调试 的 环境 ,而 需 在 测试 人 员 的 帮助 下 才能 搭建 完成 ,就 会 使 开发 人 员 的 高 效 工作 
状态 被 打 断 ， 同 时 也 会 打 断 那些 提供 帮助 的 测试 人 员 的 工作 而 对 开发 人 员 手 上 的 工作 任 
务 来 说 ， 也 只 能 停 下 来 ， 等 待 测试 人 员 搭 建 完 调试 环境 才能 继续 。 开 发 人 员 为 什么 不 能 够 
一 键 就 搭建 好 自己 所 需要 的 调试 环境 呢 ?” 这 样 不 会 打 断 任何 人 的 工作 , 浪费 任何 时 间 。 当 
然 , 还 有 很 多 类 似 的 场景 。 例 如 ， 产 品 人 员 需 要 一 些 数 据 统计 ， 只 能 向 数据 分 析 师 和 数据 
工程 师 提 出 需求 ， 由 他 们 再 去 编写 执行 。 这 也 会 出 现 等 待 。 

硅谷 互联 网 公司 在 这 些 场景 都 投入 了 大 量 精力 和 资源 进行 基础 工具 平台 的 建设 。 图 3-5 
给 出 的 是 2012 年 Facebook 公 司 所 用 的 实时 数据 监控 系统 的 界面 ,移动 开发 团队 用 这 个 平台 
可 以 实时 查看 设备 、 操 作 系统 和 App 版 本 的 统计 ， 广 告 团队 用 它 来 监控 广告 曝光 /点 击 / 收 
入 方面 的 变化 。 一 旦 发 生变 化 ， 可 以 快速 定位 到 国家 、 广 告 类 型 或 服务 器 集群 ， 并 找到 
问题 根源 ， 网 站 可 靠 性 团队 (SRE) 用 它 来 监控 服务 器 错误 (error)。 一 旦 发 生 问 题 ， 可 
以 快速 定位 到 终端 、 某 个 数据 中 心 或 服务 器 集群 的 物理 问题 ， 同 时 还 可 以 对 问题 上 报 进 


4 二 [I 大 
本 监控。 


不 同 的 业务 团队 可 以 通过 图 3-5 左 侧 设 定 的 查询 条 件 生 成 一 个 时 间 序 列 图 ， 其 中 包含 
与 Facebook 页 面 数 据 分 发 调度 相关 的 3 个 度量 维度 〈 上 中 下 3 组 对 比 曲线 ) 。 虚 线 代表 一 周 
前 的 相同 时 间 点 的 数据 ， 实 线 代 表 当 前 时 间 的 数据 。 用 这 些 图 很 容易 看 到 每 日 和 每 周 的 用 
户 周期 性 行为 变化 。 每 小 时 运行 数 千 个 监控 查询 ， 从 海量 用 户 的 反馈 中 找到 问题 ， 并 可 以 
按 不 同 维度 分 组 〈 如 地 理 位 置 、 年 龄 、 好 友 数 等 )。 
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图 3-5”2012 年 Facebook 的 实时 监控 界面 
(资料 来 产 : Lior Abraham 等 2013 年 发 表 的 “Scuba:diving into data at Facebook”) 


3.3.3 ”重复 事务 自动 化 


在 软件 研发 过 程 中 ,还 有 很 多 重复 性 的 工作 ， 如 搭建 测试 环境 、 回 归 测 试 、 应 用 部 署 
与 发 布 等 。 在 交付 频率 不 高 的 情况 下 ， 这 些 活 动 并 不 会 占用 很 多 的 工作 时 间 。 然 而 ， 随 着 
验证 环 运 转速 度 的 提高 ， 意 味 着 在 固定 的 时 间 周 期 内 ， 软 件 的 发 布 频率 提高 ， 这 种 事务 性 
工作 的 固定 成 本 占 比 也 会 越 来 越 大 。 例 如 ， 原 来 每 个 月 才 发 布 1 次 ， 现 在 每 个 月 发 布 8 次 ， 
那么 这 些 固定 成 本 就 提升 8 倍 。 而 且 ， 这 种 事务 性 工作 多 具有 机 械 重复 的 性 质 ， 不 应 该 让 
团队 成 员 来 完成 ， 而 应 该 交 给 善于 做 这 类 重复 性 工作 的 机 器 。 

因此 ,我 们 必须 通过 优化 流程 和 自动 化 措施 ， 有 效 降低 这 些 固定 的 事务 性 成 本 ,同时 
避免 不 必要 的 人 为 操作 失误 ,才能 使 其 具有 可 持续 性 。 第 16 章 介绍 的 案例 中 ， 团 队 将 “每 
3 个 月 发 布 一 次 ”提高 为 “每 两 周 发 布 一 次 ”， 就 遇 到 了 快速 发 布 带 来 的 成 本 问题 ， 最 终 也 
是 通过 自动 化 方式 解决 的 。 

3.3.4 监测 一 切 


当 软 件 在 生产 环境 运行 之 后 , 我 们 需要 能 够 及 时 准确 地 收集 并 分 析 数 据 。 对 生产 系统 
9 监测 有 两 个 目的 ,一 是 要 确认 软件 的 确 在 正常 运行 ， 一旦 发 现 异常 ， 我们 可 以 及 时 采取 
措施 ， 纠 正 错 误 ， 以 免 影响 用 户 的 使 用 。 二 是 要 及 时 得 到 有 效 业 务 数据 ， 验 证 我 们 在 探索 
环 中 提出 的 假设 。 

对 于 第 一 个 目的 的 监测 ， 可 以 称 为 “应 用 健康 监测 ”。 一 般 来 说 ,传统 运 维 领域 的 多 
数 系统 监控 软件 ， 都 是 围绕 这 方面 展开 的 ， 例 如 最 基础 的 软 硬 件 系统 健康 (包括 CPU、 内 
存 、 存 储 空间 和 网 络 连接 等 )。 再 进一步 的 应 用 健康 监控 则 是 应 用 自身 的 运行 状态 ， 如 服 
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务 响应 延迟 时 间 、 页 面 异常 、 缓 存 大 小 等 。 

对 于 第 二 个 目的 的 监测 ， 可 以 称 为 “业务 健康 监测 ”， 其 主要 是 针对 业务 指标 的 监测 。 
虽然 有 一 些 基础 性 的 日 志 收 集 整 理 展 示 平台 能 够 展示 一 些 业务 指标 , 但 是 对 于 如 何 定 义 业 
务 监 控 指 标 ， 通 常 需要 业务 团队 根据 自身 的 业务 上 下 文 和 需求 进行 定制 。 

我 们 只 有 通过 全 面 的 系统 监测 ， 并 在 第 一 时 间 发 现 异 常 ， 才 能 够 及 时 应 对 ， 以 确保 业 
务 可 持续 性 。 


3.4 小 结 


验证 环 以 快速 高 质量 交付 为 主 ， 主 要 包括 4 个 环节 ， 分 别 是 构建 、 运 行 、 监 测 和 决策 。 
在 “持续 交付 2.0” 的 “识别 并 消除 一 切 浪费 ”理念 的 指导 下 ， 验 证 环 的 4 个 工作 原则 分 别 
是 质量 内 建 、 消 除 等 待 、 重 复 事 务 自动 化 和 监测 一 切 。 只 有 坚持 这 些 指导 原则 ， 不 断 发 现 
并 消除 工作 中 的 浪费 ， 才 能 够 提升 验证 环 的 运转 效 度 ， 加 快 对 最 小 可 行 解决 方案 的 验证 。 
关于 提升 验证 环 的 更 多 方法 与 途径 ， 参 见 后 续 音 市 更 深入 的 讨论 。 
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持续 交付 2.0 的 组 织 文化 











46 持续 交付 2.0 双 环 模型 ”涉及 企业 内 多 个 部 门 与 角色 的 合作 ， 而 且 其 目标 是 缩短 端 

到 端 ( 即 从 idea 到 idea) 的 闭环 周期 , 这 必然 会 影响 内 部 合作 方式 与 流程 。“ 持 续 交 

付 2.0 的 思想 、 理 念 与 原则 可 能 与 组 织 成 员 所 熟知 的 现 有 管理 方式 和 行动 规范 有 很 大 不 同 ， 

甚至 有 冲突 之 处 。 因 此 ， 企 业 领 导 者 必须 成 为 这 一 变革 的 领导 者 ， 建 立 与 之 相 适应 的 企业 
文化 ， 使 得 “持续 交付 2.0” 成 为 企业 的 基因 ， 才 能 够 持续 获得 它 带 来 的 收益 。 


4.1 安全、 信任 与 持续 改善 


“持续 交付 2.0” 强 调 “ 持 续 探 索 ” 和 “快速 验证 ”"， 而 探索 必然 会 伴随 着 失败 ， 失 败 
会 令 人 产生 挫败 感 与 不 安全 感 。 而 学 习 与 成 长 也 通常 发 生 在 失败 之 后 。 这 就 要 求 组 织 必 须 
建立 “安全 、 互 相信 任 和 持续 改善 ”的 组 织 文 化 。 

4.1.1 失败 是 安全 的 

一 个 组 织 对 待 “ 失 败 ” 的 态度 至 关 重 要 ， 无 论 是 试验 中 的 失败 ， 还 是 组 织 改 进 中 的 失 
败 。 我 们 在 持续 交付 “8” 字 环 的 探索 环 中 ， 识 别 了 很 多 假设 ， 为 这 些 假 设 建立 了 衡量 标 
准 ， 并 对 验证 环 的 结果 进行 了 度量 。 这 些 试验 结果 不 应 该 用 于 直接 评判 个 人 ， 否 则 会 使 组 
织 成 员 在 设计 方案 时 倾向 于 “为 了 证 真 而 设计 ”， 而 非 “ 为 了 证 伪 "。 这 样 ， 我 们 也 很 难 从 
这 种 “持续 成 功 ” 中 学 到 更 多 的 知识 。 

对 于 组 织 改 进 也 是 如 此 。 组 织 是 一 个 复杂 系统 ， 它 的 改进 更 为 复杂 。 如 果 组 织 成 员 发 
现 ， 在 组 织 中 “犯错 ”是 个 很 糟糕 的 事情 ， 会 受 惩罚 ， 那 么 ， 为 了 避免 出 错 受到 惩罚 ， 组 
组 成 员 就 会 放弃 做 出 有 风险 的 决策 。 

在 一 个 高 度 不 确定 的 环境 中 , 没有 人 能 够 保证 自己 的 决策 不 会 出 错 。 如果 无 法 让 组 织 
成 员 感 到 “失败 是 安全 的 "， 那 么 组 织 成 员 的 行为 就 会 倾向 于 避免 犯错 ， 各 扫 门 前 雪 ， 逃 
避 责 任 ， 缺 少 合作 。 


4.1.2 ”相互 信任 
相互 信任 是 高 效 合 作 的 基础 ,也 是 组 织 凝 聚 力 和 成 员 士气 的 基础 。 成 员 之 间 的 相互 信 
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任 既 包括 对 彼此 个 人 品质 的 信任 ， 同 时 也 包含 对 专业 能 力 的 信任 。 这 种 信任 是 相互 的 ， 赢 
得 他 人 信任 的 同时 ， 也 要 信任 他 人 ， 认 可 他 人 的 个 人 品质 与 专业 素养 。 如 果 组 织 成 员 之 间 
缺乏 信任 ， 那 么 很 容易 出 现 相 互 猜 避 、 相 互 指责 的 现象 ， 用 不 了 多 入， 就 会 影响 成 员 在 组 
组 内 的 安全 感 ， 降 低 工作 效率 。 

在 过 去 的 十 多 年 中 , 很 多 组 织 采 纳 敏 捷 软 件 开 发 方法 , 但 是 并 没有 取得 企业 所 预期 的 
效果 ， 除 一 些 技术 改进 的 原因 以 外 ， 一 个 不 可 忽视 的 原因 就 是 “相互 信任 ”文化 的 缺失 。 
当 这 种 文化 缺失 时 ， 常 常会 让 人 感受 到 “产品 人 员 抱 怨 开发 人 员 不 给 力 ”和 “开发 人 员 认 
为 产品 人 员 不 靠 谱 ” 这 种 潜在 的 上 暗示。 

4.1.3 “持续 改善 


《丰田 套路 》 一 书 中 指出 :“ 丰 田 之 所 以 取得 傲 人 业绩 ， 并 不 是 源 于 我 们 可 以 看 到 的 那 
些 工具 和 方法 〈 这 里 所 说 的 “工具 和 方法 ”是 指 一 系列 精益 方法 ， 如 看 板 、 单 元 化 生产 、 
安 灯 系统 等 。 在 此 之 前 ， 业 界 将 丰田 之 所 以 高 效 的 原因 归结 于 丰田 采用 了 这 些 新 的 方法 )， 
而 是 源 于 丰田 的 行为 习惯 一 一 通过 不 断 地 试验 而 持续 改进 。” 只 有 那些 善于 “持续 改善 ”， 
并 使 之 形成 一 种 自身 文化 的 企业 才 会 不 断 进步 。 

持续 改善 文化 的 特点 是 “人 人 参与 ”和 “时 时 改善 人 人 人 参与 ”是 指 “ 持 续 改善 * 
不 应 该 只 是 组 织 中 某 个 角色 的 责任 ， 而 应 该 是 所 有 大 的 责任 a>“ 时 时 改善 ”是 指 “ 持 续 改 
善 ”应 该 是 一 项 日 常 工作 ， 而 不 应 该 只 在 特定 时 间或 条 件 下 才 发 生 ， 例 如 只 在 事故 发 生 之 
后 才 进 行 分 析 和 改进 。 


4.2 文化 塑造 四 步 法 


文化 是 无 形 的 ， 很 难 改变 。 它 在 影响 组 织 成 员 行为 的 同时 ， 也 会 受 组 织 成 员 的 行为 影 
响 而 发 生变 化 。Jez Humble 和 Joanne Molesky 的 《精益 企业 》 一 书 中 指出 ,组 织 成 员 的 行动 
和 对 事情 做 出 的 反应 ， 主 要 由 组 织 领 导 者 和 管理 者 的 行为 所 决定 。 例 如 ， 人 们 是 否 有 行动 
自主 性 ， 并 获得 信任 ， 承 担 其 风险 与 责任 ， 面 对 失败 的 时 候 ， 人 们 是 否 会 受到 惩罚 ,是否 
鼓励 跨 部 门 的 沟通 等 。 

那么 ， 企 业 如 何 建立 并 维持 自己 倡导 的 组 织 文 化 呢 ? 让 我 们 看 看 丰田 公司 的 做 法 。 
4.2.1 行为 决定 文化 

20 世 纪 80 年 代 初 ,美国 通用 汽车 公司 发 现 , 丰田 汽车 公司 能 够 以 低 成 本 生产 高 质量 的 
小 型 汽车 ,而 自己 生产 的 小 汽车 的 成 本 却 很 高 ， 因 此 希望 深入 了 解 和 学 习 丰 田 汽车 的 管理 
和 制造 技术 。 而 丰田 汽车 公司 在 美国 的 产品 销售 受阻 , 因此 也 希望 寻找 一 个 本 土 合作 伙伴 ， 
在 美国 快速 建造 一 个 汽车 制造 工厂 。 于 是 ， 丰 田 公司 与 通用 公司 达成 了 合作 ,成立 了 “新 
联合 汽车 制造 公司 "， 即 NUMMI。 但 是 ， 这 个 合作 附带 了 两 个 “苛刻 条 件 ”， 一 是 新 的 合 
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资 工厂 必须 以 位 于 佛 利 蒙 市 的 通用 旧 工 厂 为 基础 进行 建设 ， 二 是 必须 重新 雇用 原矿 的 员 
工 。 为 什么 说 是 “苛刻 ”的 呢 ?” 因 为 在 当时 , 该 三 是 通用 公司 所 有 工厂 中 生产 汽车 的 质量 
最 差 的 一 家 ， 而 工厂 员工 的 劳动 纪律 也 极 差 。 很 多 工人 上 班 柄 酒 ， 聚 众 赌博 、 洲 事 ， 经 常 
罢工 和 提出 申诉 ， 员 工 旷 工人 数 比 例 常常 超过 20%， 黄 至 发 生 人 为 破坏 生产 材料 和 产品 质 
量 的 事件 。 

然而 仅 用 了 短 短 一 年 的 时 间 ， 新 公司 的 旷工 率 就 又 减 到 了 2%， 工 厂 的 产品 质量 也 从 
通用 系统 内 的 倒数 第 一 一 跃 成 为 最 佳 。 他 们 是 如 何 做 到 的 呢 ? 下 面 就 仅 以 一 个 例子 来 说 明 
丰田 公司 的 管理 方法 。 

丰田 的 核心 信条 是 “尊重 员工 ”， 而 每 个 员工 的 工作 职责 之 一 就 是 发 现 问 题 并 寻求 改 
进 方法 ， 这 与 Facebook 所 提倡 的 “没有 什么 问题 是 别人 的 问题 ”相似 。 而 作为 丰田 的 管理 
者 ， 如 果 和 希望 员工 自己 能 够 发 现 问题 ， 寻 求 改 进 ， 并 获得 自我 成 功 ， 他 就 有 义务 告诉 每 一 
位 员工 这 样 做 的 意义 在 哪里 。 丰 田 把 这 样 的 文化 带 到 了 新 联合 汽车 制造 公司 。 有 关 文化 变 
革 最 好 的 例子 就 是 著名 的 立即 暂停 系统 (stop-the-line Andon), 也 称 为 安 灯 (Andon) 系统 。 

“Andon” 本 身 是 指 一 个 信号 灯 ， 如 图 4-1 所 示 , 每 一 名 员工 都 会 接受 同样 的 生产 培训 ， 
也 就 是 说 ， 当 生产 流水 线 上 的 员工 遇 到 麻烦 ， 且 到 达 “ 预 警 提示 线 ” 时 仍旧 无 法 解决 问题 
时 ， 就 要 立即 拉 一 下 信号 灯 ， 向 他 的 班组 长 报告 。 他 的 班组 长 必须 立即 跑 过 来 帮助 他 解决 
问题 。 如 果 在 将 要 到 达 “ 完 成 指示 线 ”前 仍旧 无 法 解决 问题 ， 就 可 以 再 次 拉 下 这 个 信号 灯 。 
此 时 ， 整 条 生产 流水 线 就 会 立即 停 下 来 。 直 到 当前 遇 到 的 问题 被 解决 后 ， 生 产 流 水 线 才 恢 


复 运 行 。 
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图 4-1 丰田 汽车 公司 的 Andon 系 统 示意 图 
在 新 联合 汽车 制造 公司 成 立 之 初 ， 来 自 原 通 用 公司 的 一 些 管理 者 质疑 Andon 系 统 的 意 
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义 , 认为 管理 者 不 应 该 给 一 线 的 操作 工 如 此 大 的 权力 , 让 操作 工 自己 停止 整 条 生产 流水 线 ， 
而 是 应 该 向 上 级 请 示 ， 由 上 级 做 决定 。 而 来 自 丰田 的 管理 者 说 ,“ 不 ， 我 们 希望 给 他 们 的 
权力 是 : 当 他 们 发 现 问题 时 ， 可 以 及 时 地 停止 生产 ， 马 上 解决 存在 的 问题 ， 而 不 是 将 问题 
带 到 下 一 个 环节 。 这 样 ， 一 线 生 产 者 才 会 提升 质量 意识 ， 而 工厂 也 就 能 够 将 残 次 品 率 降 到 
最 低 。 

事实 上 ， 这 个 系统 不 只 是 一 本 操作 手册 、 一 项 原则 或 是 一 些 训练 一 一 它 是 教 每 个 人 关 
于 “如 何 高 质量 完成 工作 ”的 系统 。Andon 系 统 是 丰田 信念 和 承诺 的 缩影 ， 它 让 员工 将 生 
产 质量 作为 第 一 标准 。 

新 联合 汽车 制造 公司 工作 文化 的 转变 过 程 说 明 ，, 塑造 企业 文化 的 方法 除 “ 通 过 改变 人 
的 思想 来 改变 行为 ”以 外 ， 还 可 以 “通过 改变 行为 来 改变 思想 ”。 这 是 新 联合 汽车 制造 公 
司 的 实际 经 验 。 约 翰 * 舒 克 是 丰田 公司 雇用 的 第 一 位 外 籍 员 工 ， 经 过 十 年 的 现场 锻炼 ， 他 
对 精益 的 理念 与 方法 有 深入 的 了 解 ， 并 对 丰田 公司 开展 北美 业务 有 很 大 的 贡献 。 他 将 新 联 
合 汽 车 制造 公司 的 文化 转变 总 结 为 “四 步 法 ”。 

e 第 一 步 : 定义 我 们 想 要 做 的 事情 。 

。 第 二 步 : 定义 我 们 期 望 的 做 事 方 式 或 方法 。 

。 第 三 步 : 提供 相应 的 培训 ， 使 员工 具备 完成 其 工作 的 能 

e 第 四 步 : 设计 一 些 必要 的 机 制 或 措施 来 强化 我 们 所 鼓励 的 那些 行为 。 

通过 这 4 个 步 又， 企业 可 以 让 员工 成 功 掌握 完成 自己 工作 的 方法 。 最 终 ， 文 化 就 会 被 
改变 。 通 过 这 种 方式 ， 企 业 就 可 以 建立 其 所 希望 的 企业 工作 环境 ， 而 工作 环境 会 对 人 产生 
很 大 的 影响 。 

组 织 文化 是 一 系列 行为 结果 的 展现 ， 体 现在 人 与 人 之 间 的 日 常 工作 交互 中 ， 因 此 我 们 
无 法 直接 改变 “组 织 文化 ”。 但 是 ,我们 可 以 通过 培训 企业 员工 具备 必要 的 能 力 ， 同 时 规范 
员工 的 做 事 方式 ， 而 达到 塑造 企业 文化 的 目的 。 这 种 方法 在 互联 网 企业 中 也 是 常见 的 。 


4.2.2 谷歌 的 工程 师 质 量 文化 


现在 ,谷歌 是 一 个 非常 强调 软件 质量 的 公司 ,其 要 求 每 次 提交 代码 变更 时 ， 都 必须 经 
过 其 他 工程 师 的 代码 评审 ， 才 能 合并 到 代码 库 中 。 而 且 在 每 次 代码 评审 中 ， 代 码 评审 者 必 
须 是 一 名 具有 代码 可 读 性 评审 资质 的 人 才 行 。 若 想 成 为 具有 这 种 评审 资质 的 人 ， 工程师 必 
须 自 己 提出 申请 ， 再 由 一 个 评审 小 组 评定 通过 后 才 可 以 。 

谷歌 的 代码 质量 文化 还 体现 在 其 开发 工程 师 的 自动 化 测试 行为 上 。 谷歌 开发 工程 师 自 
己 会 针对 自己 的 代码 写 自动 化 测试 用 例 。 在 每 次 提交 代码 评审 之 前 ， 都 必须 运行 相应 的 自 
动 化 测试 用 例 ， 并 且 其 运行 结果 会 一 并 发 送 给 代码 评审 者 作为 参考 。2013 年 John Penix 在 
“Large-Scale Continuous Testing in the Cloud” ( 云 上 的 大 规模 持续 测试 ) 中 提 到 ，2012 年 谷 
歌 已 有 约 1 万 名 工程 师 ， 每 天 运行 5 万 次 构建 ，5000 万 个 测试 用 例 。 
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然而 ,谷歌 并 非 从 一 开始 就 是 这 样 工 作 的 。 早 在 2005 年 时 ,谷歌 也 存在 大 量 的 手工 测 
试 工作 。 由 于 团队 规模 快速 增长 ， 业 务 系 统 越 来 越 复 杂 , 测试 工程 师 忙 得 不 可 开交 。 而 且 ， 
生产 问题 也 不 断 出现 ， 很 多 开发 工程 师 天 天 处 于 “救火 ”状态 。 于 是 公司 开始 建立 工程 师 
质量 文化 ， 它 的 做 法 也 可 以 总 结 为 以 下 4 步 。 
第 一 步 : 定义 想 要 做 的 事情 
e 提高 代码 质量 ， 减 少 生产 问题 ， 减 少 手工 测试 工作 量 ， 快 速 发 布 软件 。 
第 二 步 : 定义 期 望 的 做 事 方法 
e 开发 团队 编写 自动 化 测试 。 
e 主动 运行 自动 化 测试 用 例 。 
e 做 代码 评审 〈code review ) 。 
第 三 步 : 提供 相应 的 培训 
e 在 公司 范围 内 组 织 代码 设计 与 自动 化 测试 培训 。 
e 为 每 个 团队 指派 自动 化 测试 教练 ， 帮 助 团队 提高 自动 化 测试 技能 。 
第 四 步 : 做 些 必需 的 事情 来 强化 那些 行为 
e 建立 团队 测试 认证 机 制 (test certified mechanism) ， 共 分 3 个 大 级 别 ，12 个 子 级 ， 用 
于 评估 每 个 软件 产品 团队 的 测试 成 熟 度 。 通 过 每 个 季度 统计 各 级 别 上 的 团队 数量 
分 布 ， 来 评估 自动 化 测试 文化 在 公司 内 部 的 进展 程度 。 

e 建立 自动 化 测试 组 (test group) 和 测试 教练 组 (test mentor) ， 帮 助 团队 提升 自动 
化 测试 能 

e 建立 代码 评审 资质 证 书 。 

e 代码 合 入 版 本 仓库 之 前 强制 做 代码 评审 。 

e 代码 评审 之 前 ， 必 须 运行 自动 化 测试 用 例 ， 并 提交 报告 给 代码 评审 者 。 

当然 , 这 4 步 并 不 是 非常 容易 。 谷 歌 的 执行 过 程 也 花费 了 4 年 的 时 间 ， 其 中 还 有 很 多 非 
营 具 体 的 细节 ， 在 这 里 不 再 展开 讨论 。 


4.2.3 ”Etsy 的 持续 试验 文化 


Etsy 在 2012 年 时 ， 全 部 员工 也 不 到 200 人 ， 网 站 每 天 平均 部 署 代码 25 次 左右 ， 配 置信 
息 的 部 署 平均 在 30 次 左右 , 如 图 4-2 所 示 , 每 次 部 署 只 需要 一 个 人 用 15 分 钟 就 可 以 完成 。 这 
正 是 因为 Etsy 鼓 励 “ 持 续 试 验 ” 的 文化 。 

下 面 是 它 的 具体 做 法 。 

第 一 步 : 定义 想 要 做 的 事情 

e 不 必 害 怕 失 败 ， 快 速 发 布 ， 持 续 试 验 。 

第 二 步 : 定义 期 望 的 做 事 方法 

。 每 天 向 生产 环境 多 次 部 署 。 
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50 第 4 章 持续 交付 2.0 的 组 织 文化 





。 部 署 后 立即 进行 数据 收集 和 统计 分 析 。 
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图 4-2 ”Etsy 的 软件 及 配置 部 署 频率 
(资源 来 源 : Mike Brittain 在 GOTO Aarhus 2012 大 会 上 发 表 的 “Continuous Delivery: The Dirty Details” ) 


第 三 步 : 提供 相应 的 培训 
。 在 每 一 个 新 员工 入 职 第 一 天 , 就 被 要 求 把 自己 的 照片 发 布 到 Etsy.com 的 网 站 上 。 作 
为 新 员工 ， 这 是 一 个 简单 的 任务 ， 它 让 你 知道 在 哪里 找到 模板 文件 ， 如 何 将 自己 
的 照片 放 在 上 面 。 这 样 ， 你 就 知道 如 何 登 录 自 己 的 虚拟 机 ， 把 代码 放 在 哪里 ， 如 
何 运 行 自动 化 测试 ， 以 及 如 何 部 署 代 码 到 生产 环境 ;> 在 哪里 查看 度量 仪表 盘 ， 确 
保 部 署 后 一 切 都 运行 正常 。 其 目的 是 让 新 员工 三 开 始 就 了 解 部 署 过 程 ， 不 至 于 对 
部 署 产生 旦 惧 。 
。 “持续 试验 ”相关 培训 , 例如 第 2 章 中 提 到 的 搜索 框 重 构 案 例 讲述 如 何 将 大 项 目 分 
解 成 多 个 小 项 目 ， 并 且 每 个 小 项 目 都 可 以 收集 相关 的 数据 ， 以 验证 该 小 项 目 最 初 
的 假设 。 
第 四 步 : 做 些 必需 的 事情 来 强化 那些 行为 
。 每 次 业务 变更 都 要 进行 数据 衡量 。 
e 从 真实 数据 中 学 习 ， 无 论 是 失败 还 是 成 功 。 
e 开发 相应 工具 ， 提 高 部 署 和 数据 收集 分 析 能 
Facebook 公 司 也 有 类 似 的 做 法 。 每 个 工程 师 在 入 职 时 都 要 参加 新 员工 训练 营 。 这 个 训 
练 营 通常 持续 4 周 。 在 第 一 周 ， 绝 大 部 分 工程 师 提 交 的 代码 就 会 发 布 到 生产 环境 中 。 到 第 
二 周 时 ， 几 乎 所 有 新 员工 写 的 代码 都 至 少 会 被 发 布 一 
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虽然 ， 我 们 总 结 了 塑造 企业 文化 的 四 步 法 ， 但 在 实际 执行 过 程 中 ， 我 们 仍旧 会 遇 到 各 
种 各 样 的 挑战 。 因 为 ， 在 管理 学 中 ， 经 常 把 一 个 公司 看 作 是 复杂 系统 ， 它 兼 有 简单 系统 和 
随机 系统 的 各 种 特征 。 复杂 系统 (complex system) 是 指 具有 中 等 数目 基于 局 部 信息 做 出 行 
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动 的 智能 性 、 自 适应 性 组 件 (也 称 为 主体 ) 的 系统 。 复 杂 系 统 较 难 定义 ， 且 它 存 在 于 世界 
各 个 角落 。 它 既 不 是 简单 系统 ， 也 不 是 随机 系统 ， 而 是 一 个 非 线性 的 复合 (complex) 的 系 
统 。 它 内 部 有 很 多 子 系统 (subsystem) ,这些 子 系统 之 间 又 是 相互 依赖 的 (interdependence )， 
子 系统 之 间 有 许多 协同 作用 ， 可 以 共同 进化 (coevolving)。 

正 因为 企业 或 组 织 具 有 复杂 系统 的 特点 ， 所 以 任何 举措 都 会 给 这 个 复杂 系统 带 来 变 
化 。 因 此 ， 我 们 应 该 以 “价值 导向 ， 快 速 验证 ， 持 续 学 习 ” 作 为 行动 原则 。 


4.3.1 价值 导向 


所 有 人 都 会 一 致 同意 ,“ 我 们 做 事情 时 ， 应 该 价值 导向 ”。 然 而 ， 这 却 是 在 工作 中 经 常 
被 忽视 的 一 点 ， 也 是 最 难 判断 的 一 点 。 说 它 经 常 被 忽视 ， 是 因为 我 们 每 天 有 太 多 的 事情 要 
做 。 为 了 能 够 早 一 点 儿 完 成 所 有 任务 ,我们 常常 忘记 思考 完成 这 些 任务 的 最 终 目 的 ， 以 及 
它 与 目标 之 间 的 关系 。 为 了 能 够 做 出 正确 的 判断 ， 我 们 应 该 时 常 强迫 自己 停 下 来 ， 花 一 些 
时 间 ， 认 真 思考 一 下 我 们 手头 上 正在 做 的 事情 是 否 仍旧 具有 价值 ， 是 否 仍旧 最 有 价值 。 

说 它 难 以 判断 , 是 由 于 组 织 中 每 个 人 的 背景 与 经 历 各 不 相同 ， 对 外 部 市 场 环境 的 感知 
也 各 不 相同 ,对 于 同一 个 工作 场所 带 来 的 价值 感 也 会 有 所 不 同 。 因 此 ， 当 我 们 讨论 “价值 ” 
时 ， 应 该 限定 于 一 定 的 业务 上 下 文 ， 避 免 离 题 太 远 。 同 时 ， 在 讨论 时 应 该 尽量 提供 完整 的 
上 下 文 ， 并 聆听 他 人 的 方案 与 建议 。 

即便 进行 了 充分 的 沟通 与 讨论 , 面 对 同 一 个 问题 的 多 种 解决 方案 , 我 们 可 能 也 无 法 达 
成 一 致意 见 。 此 时 ， 我 们 可 以 采用 行动 原则 的 第 二 原则 ， 即 “快速 验证 ”。 


4.3.2 快速 验证 


在 高 度 不 确定 的 环境 中 ， 并 不 是 所 有 的 方案 都 能 很 容易 提前 对 其 价值 进行 准确 判断 ， 
因此 我 们 需要 快速 验证 。 通 过 快速 实施 ， 得 到 真实 反馈 ， 从 而 做 出 决策 。 在 一 个 安全 的 工 
作 环 境 中 ， 只 要 我 们 能 够 主动 拥抱 “快速 验证 ”原则 ， 充 分 发 挥 员工 的 主观 能 动 性 ， 就 可 
以 找到 很 多 快速 试验 方案 。 

对 于 与 组 织 管理 相关 的 改进 ， 也 可 以 使 用 快速 验证 方式 。 例 如 ， 针 对 有 具体 问题 ， 选 择 
不 同 的 试点 团队 进行 快速 实施 ， 根 据 团队 实际 运行 效果 进行 调 优 、 验 证 。 


4.3.3 ”持续 学 习 


我 们 无 法 保证 每 个 决策 都 是 正确 的 。 团 队 应 当 将 每 一 次 反馈 作为 一 次 学 习 的 机 会 ， 结 
合 从 中 学 习 到 的 新 知识 ， 总 结 成 功 经 验 或 失败 教训 。 除 了 通过 业务 试验 产生 的 业务 结果 对 
业务 领域 进行 深入 了 解 和 学 习 ， 还 要 保持 对 做 事 过 程 的 学 习 与 反思 ， 不 断 优化 工作 流程 ， 
提升 各 环节 的 效率 。 

对 于 团队 日 常 工作 过 程 的 学 习 与 反思 ， 有 两 种 常见 的 方式 ， 一 是 定期 回顾 ， 二 是 事件 
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复 盘 机 制 。 

1. 定期 回顾 

定期 回顾 是 指 每 隔 一 定 周期 , 团队 主动 安排 一 次 会 议 , 共同 讨论 在 过 去 的 这 个 周期 内 ， 
团队 在 协作 过 程 中 的 优点 与 不 足 , 并 讨论 相应 的 对 策 , 以 便 在 后 续 的 工作 中 能 够 保持 优点 ， 
改进 不 足 , 持续 取得 进步 。 在 敏捷 软件 开发 方法 中 , 有 一 个 非常 重要 的 团队 实践 , 名 为 “ 回 
跨 会 议 ” (retrospective meeting) ， 其 作用 就 在 这 里 。 

Norm Kerth 在 《项 目 回 顾 》(Project Retrospectives: 4A Handbookfor Team Reviews) 一 书 
中 指出 ， 在 回顾 会 议 开 始 时 ， 一定 要 强调 回顾 宣言 ， 即 “无 论 我 们 发 现 了 什么 问题 ， 我 们 
必须 懂得 并 坚信 : 每 个 人 根据 他 当时 所 知 、 他 所 拥有 的 技能 和 可 得 到 的 资源 ， 在 当时 限定 
的 环境 中 ,已 经 尽 其 最 大 努力 了 ”。 这 就 是 在 强调 团队 的 “安全 ”与 “信任 ”文化 。 

另外 , 还 需 注意 的 是 ,回顾 会 议 结束 后 ,应 该 有 改进 措施 与 计划 ,并 能 够 跟踪 执行 结果 。 
同时 ， 不 要 制订 过 多 的 改进 项 ， 以 免 落 入 “反复 提出 ， 反 复 执行 ， 没 有 实际 进展 ”的 境况 。 

2. 复 盘 机 制 

复 盘 机 制 通 常 是 指针 对 发 生 的 问题 进行 分 析 ， 其 目的 是 避免 相同 问题 重复 出 现 。 首 先 
要 针对 问题 发 生 的 前 后 进行 信息 收集 与 整理 ， 确 定 问 题 的 严重 程度 ， 理 解 问题 发 生 的 过 程 
(对 于 疑难 问题 ， 可 能 还 需要 在 事故 后 进行 线 下 模拟 测试 ， 基 至 线 上 测试 ， 以 复 现 问题 和 寻 
找 原因 )。 然后 进行 根 因 分 析 , 最 后 总 结 经 验 ,， 制 订 改 进 措施 与 计划 , 并 能 够 跟踪 执行 结果 。 

对 于 根本 原因 分 析 ， 需 要 注意 以 下 几 点 。 

(1) 放松 心态 ， 开 放 共 享 。 






















































































(2) 分 清 “ 因 ”和 “ 果 ”。 

(3) 五 问 法 ， 鼓 励 多 问 “ 为 什么 ”。 

(4) 发 挥 群 体 智慧 。 

(5) 不 要 停 于 表面 ， 而 要 寻找 识 层次 原因 。 





(6) 对 答案 进行 求证 。 

值得 一 提 的 是 ， 对 于 每 一 次 复 盘 ， 都 应 该 详细 记录 和 总 结 ， 作 为 知识 在 企业 中 全 员 共 
享 。 只 有 这 样 ， 才 能 收益 最 大 化 。 

在 以 上 两 种 学 习 方 式 中 ， 都 应 该 运用 “系统 思 孝 ”方法 。 系 统 思考 是 从 整体 上 对 影响 
系统 行为 的 各 种 力量 与 相互 关系 进行 思考 ， 以 培养 人 们 对 复杂 性 、 相 互 依存 关系 、 变 化 及 
影响 力 的 理解 与 决策 力 。 简 单 来 说 ， 就 是 对 事情 全 面 思 雳 ， 不 能 仅 是 就 事 论 事 ， 而 是 把 想 
要 获得 的 结果 、 实 现 该 结果 的 过 程 、 过 程 优化 以 及 对 未 来 的 影响 等 一 系列 问题 作为 一 个 整 
体系 统 进行 研究 。 在 传统 的 思维 模式 中 ， 人 们 假设 因 与 果 之 间 是 线性 作用 的 ， 即 “ 因 ” 产 
生 “ 果 ”; 但 在 系统 思考 中 ， 因 与 果 并 不 是 绝对 的 ， 因 与 果 之 间 有 可 能 是 环形 互动 的 ， 即 
“ 因 ” 产 生 “ 果 ”， 此 “ 果 ” 又 成 为 他 “ 果 ” 之 “ 因 ”， 其 至 成 为 “ 因 ” 之 “ 因 ”。 下 面 我 们 
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用 一 个 具体 的 案例 来 说 明 系 统 思 考 的 使 用 方式 。 


系统 思考 的 实际 应 用 

该 案例 发 生 在 某 知名 互联 网 企业 的 一 个 基础 产品 业务 部 门 .该 部 门 负责 互联 网 信息 
收集 业务 ， 大 约 有 120 人 ， 整 个 部 门 分 成 5 个 小 组 ， 分 别 负 责 不 同 的 业务 领域 ， 每 个 组 的 
成 员 人 数 相当 。 

这 个 部 门 遇 到 的 问题 是 : 每 当 季 度 结束 时 ， 各 团队 都 无 法 全 部 完成 自己 在 该 季度 之 初 
制订 的 重要 项 目 。 而 且 ， 每 个 小 组 的 负责 人 都 认为 这 些 重要 项 目 进度 很 难 把 握 ， 计 划 经 党 
被 打 乱 ， 时 间 不 够 用 。 上 有 具体 项 目的 负责 人 也 经 常 抱怨 事情 多 ， 什 么 都 干 不 完 ， 成 就 感 较 低 。 

于 是 ,部 门 总 经 理 和 团队 核心 管理 成 员 一 起 坐 下 来 ,对 这 些 问题 进行 了 总 结 与 分 析 ， 
得 出 的 分 析 结 果 如 图 4-3 所 示 。 





图 4-3 组 织 管理 中 的 系统 思考 示意 图 





我 们 可 以 看 到 ， 图 中 的 节点 互 为 因果 ， 且 互 为 增强 。 例 如 ， 一 旦 某 个 项 目的 时 间 周 
期 拖 长 ,就 会 有 紧急 且 重 要 的 新 需求 插入 到 当前 的 项 目 工作 中 ,这 会 占用 该 项 目的 人 力 
资源 ， 使 原 有 项 目的 周期 拖 得 更 长 。 而 且 ， 新 需求 若是 一 个 新 项 目 ， 就 会 变 成 多 项 目 并 
行 。 在 人 力 资源 不 充分 ， 无 法 及 时 补充 的 情况 下 ， 为 了 满足 多 项 目 方 的 时 间 要 求 ， 所 有 
人 必须 加 班 赶 进 度 ， 员 工 疲 惫 度 增 加 ， 工 作 难 免 会 有 遗漏 ， 从 而 造成 交付 质量 降低 ， 缺 
陷 数 量 增加 ; 这 就 会 导致 修复 缺陷 和 验证 所 需 时 间 更 多 , 更 进一步 导致 项 目 周期 再 次 拖 
长 。 由 于 测试 团队 并 非 与 开发 团队 在 同一 组 织 内 ， 而 项 目 延 迟 导 致 计划 有 交 ， 测试 人 员 
被 频繁 调动 , 使 得 对 项 目 验 收 的 测试 人 力 安 排 很 困难 , 从 而 导致 开发 人 员 完 成 提 测 以 后 ， 
还 需要 等 待 测试 人 员 就 位 ， 这 又 进一步 拖 长 项 目 周期 。 

看 上 去 ， 这 些 问 题 因果 相交 ， 环 环 相 扣 ， 似 乎 注定 这 个 团队 会 有 这 样 的 执行 结果 。 
但 我 们 发 现 ， 似 乎 所 有 的 矛头 都 指向 了 “人 力 配置 短缺 ”这 个 节点 。 事 实证 明 ， 这 也 是 
我 在 所 有 咨询 工作 中 听 到 过 的 最 多 的 一 句 话 一 一 “我 们 缺 人 ， 需 要 更 多 的 人 ”。 当 然 ， 
还 有 一 句 话 可 以 相提并论 ， 那 就 是 “需求 太 多 ”. 
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上 述 这 些 现象 和 最 初 的 “项 目 时 间 长 ”一 样 ， 只 是 整个 系统 运行 的 结果 ， 需 要 针对 
它们 做 进一步 的 分 析 ， 才 能 找到 导致 这 些 现象 的 原因 ， 最 终 找 出 对 策 (之 所 以 称 为 “对 
策 ”"， 是 因为 很 多 时 候 我 们 并 不 确定 它 是 否 的 确 是 该 问题 的 解决 方案 )。 于 是 ,管理 团队 
针对 每 一 个 现象 进行 了 进一步 分 析 ， 发 现 了 更 多 的 信息 。 

该 部 门 在 每 个 季度 本 都 要 制订 下 一 个 季度 的 工作 规划 ,而 每 个 小 组 者 会 给 自己 小 组 
在 本 季度 内 定义 3 到 5 个 部 门 级 重要 项 目 ， 这 一 类 项 目 通常 被 称 为 P0 级 项 目 。 通常 来 说 ， 
P0 级 项 目 业 务 重要 程度 高 ， 资 源 投入 多 ， 对 时 间 点 的 要 求 比较 严格 。 既然 有 一 级 项 目 ， 
当然 也 就 有 其 他 级 别 的 项 目 。 该 部 门 的 项 目 等 级 还 包括 P1、P2 和 P3， 这 些 项 目的 数量 会 
更 多 一 些 , 但 等 级 越 低 ,资源 投入 相对 越 少 , 项 目 时 长 相对 越 短 . 由 于 为 了 赶 项 目 进度 ， 
团队 留 给 做 业务 规划 的 时 间 变 少 ， 但 时 间 的 钟 摆 不 会 停 下 来 ， 导 致 业务 规划 准备 不 足 ， 
思考 不 充分 ， 从 而 制订 的 下 一 季度 规划 并 不 合理 ， 导 致 同样 的 问题 再 次 发 生 。 

在 图 4-4 中 ， 我 们 可 以 看 到 这 些 问题 涉及 组 织 管理 中 的 方方面面 。 包 括 组 织 规划 、 
人 员 能 力 、 软 件 架构 、 流 程 制度 与 组 织 激励 ， 以 及 受 外 界 影 响 的 很 多 非 可 控 因素 。 

投入 思考 时 间 不 足 目标 不 详细 / 
G milestone 不 明确 









; 项 目 优先 级 不 一 








: 自我 驱动 盲目 乐观 ; 





lS 线 上 
问题 ) | 互联 网 新 情况 





系统 框架 不 理想 © 试验 成 本 高 项 目 间 
RD 疝 协作 无 跟踪 | 人 依 天 












项 目 试 运行 ”多数 项 目 都 不 
QA 优先 级 不 一 致 


外 面 需求 变化 ET 


(提前 介入 ) 


需求 方 没有 


优先 级 本 身 低 
开发 到 上 线 时 间 长 ] 深入 思考 需求 (改观 了 新 的 工作 量 


图 4-4 ”信息 挖掘 示意 图 
在 组 织 规划 方面 ， 表 现 为 : 
e@ 目标 太 多 ， 不 翔实 ， 规 划 投 入 时 间 不 足 ， 导 致 规划 不 清晰 ; 
@ 对 目标 的 设 定 不 够 重视 ; 
e@ 规划 活动 的 时 间 不 充分 ， 导 致 对 项 目 承 诺 无 约束 力 。 
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在 人 员 能 力 方面 ， 表现 为 : 
e@e 盲目 乐观 ， 对 困难 评估 不 足 ; 
@ 人 的 意识 与 能 力 不 足 导致 的 误 操 作 引 起 线 上 问题 ; 
@ 分 析 能 力 不 足 (机 器 资源 与 软件 性 能 考虑 不 周 )， 导 致 规划 不 清晰 。 
在 软件 架构 方面 ， 表 现 为 : 
e@ 系统 框架 不 理想 ， 试 验 的 成 本 高 ， 导 致 项 目 之 间 依 赖 严重 ; 
@ 算法 策略 与 框架 的 自 适 应 性 低 ， 导 致 出 现 线 上 问题 。 
在 组 织 流 程 制 度 与 组 织 激励 方面 ， 表 现 为 : 
缺乏 有 效 的 激励 机 制 ， 导 致 项 目 评估 与 承诺 相对 草率 ; 
对 外 部 需求 的 管理 不 足 ， 导 致 预 估 工 作 量 不 准 ; 
开发 工程 师 与 测试 工程 师 的 工作 模式 不 协调 ， 沟 通 协作 不 顺畅 ， 导 致 多 项 目 并 行 ; 
开发 工程 师 所 负责 的 模块 之 间 协 作 开 发 任务 无 跟踪 ， 导 致 不 必要 的 等 待 与 沟通 
时 间 。 

在 非 自身 可 控 的 外 部 事件 方面 ， 表 现 为 : 

e 互联 网 新 情况 带 来 的 流量 异常 波动 ; 

@ 市 场 环 境 发 生变 化 ， 导 致 业务 方向 的 临时 调整 ; 

e@ 其 他 业务 部 门 的 紧急 需求 。 

管理 团队 经 过 讨论 并 最 后 一 致 认为 ， 整 个 团队 目前 最 核心 的 问题 是 : 规划 不 清晰 。 
目前 ， 部 门 以 各 子 团 队 为 单位 进行 季度 规划 ， 叶 致 各 团队 本 位 思考 。 每 个 团队 都 希望 建 
立 更 多 的 重点 项 目 ， 争 夺 更 多 的 资源 ， 使 得 整个 部 门 无 重点 可 言 。 

因此 ,在 后 续 的 规划 中 ， 应 该 以 整个 团队 为 单位 ，P0 级 项 目 在 一 个 季度 内 规划 数量 
不 应 该 多 于 6 个 ， 这 6 个 项 目 由 管理 团队 共同 讨论 决定 。 并 在 每 个 月 度 会 议 中 ,管理 团队 
根据 实际 情况 ， 可 以 调整 这 6 个 项 目的 优先 级 ， 从 而 实现 每 个 月 都 可 以 “聚焦 突破 ”， 完 
成 核心 业务 要 务 。 





4.4 度量 原则 


“如 果 不 能 度量 ， 就 无 法 改进 。 一 个 世纪 前 ， 现 代 管 理学 之 父 披 得 德 鲁 克 曾经 说 过 
“you can’t manage what you can’t measure” (你 无 法 管理 你 不 能 衡量 的 事情 )。 这 和 句 话 的 意 
思 是 除非 成 功 被 定义 ， 并 且 被 跟踪 ， 否 则 你 无 法 知道 自己 是 否 成 功 。 由 此 可 见 ， 度 量 对 企 
业经 营 管理 的 重要 性 。 而 在 组 织 改 进 的 过 程 中 ， 我 们 同样 需要 收集 度量 数据 ， 来 衡量 我 们 
的 进步 。 

然而 ， 作 为 管理 者 ， 我们 也 必须 承认 ， 在 日常 工作 当中 , 仍旧 有 一 些 我 们 现在 还 无 法 
度量 但 必须 进行 管理 的 事情 ， 尤 其 是 在 一 个 高 度 不 确定 的 环境 当中 。 这 是 讨论 度量 原则 的 
一 个 前 提 。 
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4.4.1 度量 指标 的 4 类 属性 

度量 指标 分 为 引领 性 指标 、 请 后 性 指标 、 可 观测 性 指标 和 可 行动 性 指标 。 下 面 就 来 分 
别 介绍 一 下 。 

1. 引领 性 指标 与 滞后 性 指标 

引领 性 指标 是 指 那 些 对 达成 预定 目标 有 着 重要 作用 的 指标 。 通常 , 一 个 好 的 引领 性 指 
标 有 以 下 两 个 基本 特点 : 第 一 ， 它 具有 预见 性 ， 第 二 ， 团 队 成 员 可 以 影响 这 些 指标 。 

沛 后 性 指标 是 指 那些 为 了 达成 最 重要 目标 的 跟踪 性 指标 ， 如 销售 收入 、 利 润 率 、 市 场 
份额 、 客 户 满意 度 等 研究 分 析 都 属于 滞后 性 指标 。 当 你 得 到 这 些 结果 的 时 候 ， 导 致 这 些 结 
果 的 事情 早已 结束 ， 你 得 到 的 都 是 历史 性 结果 数据 。 

例如 ， 在 其 他 因素 相同 的 情况 下 ， 假 如 软件 质量 与 性 能 越 好 ， 则 软件 的 市 场 竞 争 力 
越 强 ， 客 户 就 越 愿意 为 之 买单 ， 软 件 销售 量 就 会 越 高 。 对 于 软件 销售 这 件 事情 ， 软 件 销 
售 量 就 是 一 个 浪 后 性 指标 ， 而 软件 质量 与 性 能 就 是 一 个 引领 性 指标 。 我 们 可 以 通过 优化 
软件 性 能 ， 提 升 软件 质量 来 影响 软件 销售 量 ， 但 无 法 确保 一 定 达成 软件 销售 量 这 一 滞后 
性 指标 。 

企业 的 终极 后 验 性 指标 是 客户 价值 ， 相 对 于 这 一 事后 性 指标 来 说 ， 其 他 指标 均 可 认为 
是 引领 性 指标 。 

2. 可 观测 性 指标 与 可 行动 性 指标 

可 观测 性 指标 是 指 可 以 被 客观 监测 到 , 但 无 法 通过 直接 行动 来 改变 的 指标 。 可 行动 性 
间 标 是 指 在 能 力 可 触 达 范围 内 ， 通 过 团队 努力 ， 可 以 设法 直接 改变 的 指标 。 

例如 , 千 行 代 码 缺 陷 率 就 是 一 种 可 观测 性 指标 。 我 们 无 法 以 非常 直接 的 方式 来 改变 它 ， 
只 能 通过 更 全 面 的 质量 保障 活动 ( 写 出 高 质量 的 代码 、 做 更 加 完整 的 测试 等 活动 ) 来 影响 
这 一 指标 。 

代码 规范 符合 度 、 代 码 圈 复杂 度 、 重 复 代码 率 则 既是 可 观测 性 指标 ， 也 是 可 行动 性 指 
标 , 因为 团队 可 以 直接 通过 修改 代码 来 直接 影响 和 改变 这 些 指标 , 但 无 法 确保 一 定 达 成 “ 千 
行 代码 缺陷 率 ” 这 一 后 验 性 可 观测 性 指标 。 

“DevOps 状 态 报 告 2017” 指 出 , 衡量 IT 高 绩效 组 织 的 4 个 度量 项 分 别 是 发 布 频率 、 发 布 
周期 、MTBF/MTTR、 否 吐 量 。 其 中 ， 发 布 频率 是 指 软件 部 署 并 运行 于 生产 环境 的 频率 ， 
例如 ，Facebook 手 机 App 每 周 发 布 一 次 。 该 报告 中 的 发 布 周期 是 指 从 代码 提交 到 发 布 之 间 
的 时 间 周 期 。MTBF， 全 称 是 Mean Time Between Failure， 即 平均 失效 间隔 。 就 是 新 的 产品 
在 规定 的 工作 环境 条 件 下 从 开始 工作 到 出 现 第 一 个 故障 的 时 间 的 平均 值 。MITR 的 全 称 是 
Mean Time To Repair， 即 平均 恢复 时 间 ， 指 从 故障 出 现 到 恢复 之 间 的 时 间 周 期 。 吞 吐 量 是 
在 给 定时 间 段 内 系统 完成 的 交付 物 数量 。 

如 图 4-5 所 示 , 假如 将 上 述 4 个 度量 项 作为 清 后 性 指标 的 话 , 那么 编译 速度 、 测 试 时 长 、 
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部 署 效率 等 指标 则 可 能 是 达成 这 些 目标 的 引领 性 指标 。 我 们 可 以 推断 , 从 名 后 性 指标 出 发 ， 
一 级 一 级 地 向 前 推导 ， 可 以 发 现 很 多 可 行动 性 的 引领 性 指标 。 需 要 注意 的 是 ， 指 标 之 间 的 
关联 影响 可 能 还 存在 时 间 延 迟 效应 ， 即 对 某 一 个 度量 指标 的 改善 ， 需要 经 过 一 段 时 间 , 才 
能 在 其 关联 度量 指标 上 有 所 体现 。 并 且 ， 指 标 链条 越 长 ， 可 预测 性 就 越 低 。 










终极 指标 客户 价值 
1 
1 
业务 需求 有 效 性 
1 
ee We 
} ' 发 布 频率 测试 效率 
资源 成 本 
了 发 布 周期 批量 大 小 编译 速度 
过 程 指标 软件 崩溃 率 
吞吐 量 任务 交接 
代码 质量 一 一 一 一 > 千 行 缺 陷 率 


重复 代码 率 ”代码 规范 ” 圈 复 杂 度 。 扇 入 扇 出 度 
监测 效率 监测 有 效 性 


图 4-5 软件 度量 项 的 相关 性 示意 图 
4.4.2 度量 的 目标 是 改善 

我 们 可 以 通过 设法 管理 过 程 指标 来 改善 我 们 的 工作 过 程 , 并 将 最 终 的 效果 与 我 们 期 望 
的 结果 指标 做 对 比 ， 从 而 发 现 改进 是 否 有 效 ， 并 判断 是 否 需要 改变 改进 方向 ， 还 是 继续 向 
前 。 但是， 过程 指标 离 终 极 结果 指标 越 远 ， 对 终极 结果 的 影响 作用 就 越 不 明确 ， 其 贡献 越 
不 直接 。 

因此 , 我 们 需要 不 断 依据 反馈 的 度量 结果 做 出 分 析 后 再 确定 改进 的 方向 , 是 继续 向 前 ， 
还 是 另 寻 他 法 。 度 量 是 一 柄 双 刃 剑 ， 对 可 行动 性 的 过 程 指标 来 说 ,“ 你 衡量 什么 ， 就 会 得 
到 什么 ” ， 但 并 不 一 定 是 以 你 想 要 的 方式 达成 的 。 例 如 ， 当 度量 单元 测试 覆盖 率 时 ， 工 程 
师 可 以 通过 写 出 无 用 的 单元 测试 (如 没有 断言 ;， 达 成 单元 测试 覆盖 率 指标 ， 但 是 这 种 济 
试 覆盖 率 已 没有 任何 意义 。 因 此 ， 管 理 者 需要 记 住 ， 度 量 的 目标 是 为 了 组 织 改 善 。 如 果 达 
不 到 度量 目的 ， 则 要 么 改 用 其 他 度量 项 ， 要 么 做 好 管理 工作 。 


4.5 “改善 套路 ”进行 持续 改进 
提升 “持续 交付 2.0 能 力 ”并 没有 唯一 的 标准 实现 路 径 。 对 每 个 企业 来 说 ,“ 软 件 每 天 
发 布 n 次 ”未 必 是 它 当 前 状态 下 的 最 优选 择 。 每 个 企业 必须 根据 自己 所 在 行业 的 特点 、 所 


处 的 竞争 环境 ， 以 及 产品 的 具体 形态 以 及 企业 的 组 织 人 员 能 力 等 实际 情况 ， 选 择 自 己 的 
道路 。 
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那么 ， 我 们 到 底 应 使 用 什么 方法 开始 我 们 的 “持续 交付 2.0 能 力 ” 提 升 之 路 呢 ? 迈克 。 
和 鲁 斯 在 《丰田 套路 : 转变 我 们 对 领导 力 与 管理 的 认 知 》 一 书 中 介绍 了 一 种 “改善 套路 ”， 
它 包 含 4 个 阶段 ， 以 循环 方式 不 断 重复 ， 如 图 4-6 所 示 。 








建立 下 一 个 
目标 状态 


迭代 式 迈 向 
目标 状态 





执行 





EE | 





图 4-6 ”改善 套路 
(资料 来 源 : 由 迈克 * 和 鲁 斯 提供 ) 


e 第 一 阶段 : 明确 方向 。 管 理 者 需要 明白 ， 企 业 必 须 始终 以 愿景 为 工作 目标 ， 并 持 
续 不 断 地 改进 。 在 前 进 的 路 上 ， 必 然 会 遇 到 问题 。 我 们 需要 通过 不 断 试验 与 迭代 ， 
才能 达成 目标 。 
。 第 二 阶段 : 掌握 当前 状态 。 团 队 要 掌握 当前 的 状态 地 获得 事实 与 数据 ， 才 能 充分 
认识 自己 ,以 对 下 一 步 目 标 状态 进行 合理 的 描述 。 
。 第 三 阶段 :定义 下 一 个 目标 状态 。 目 标 状态 就 是 确定 团队 希望 达到 的 状态 ,设置 
期 望 达 到 该 状态 的 日 期 ， 并 定义 可 衡量 的 指标 项 。 
e 第 四 阶段 : 迭代 改进 。 遵 循 戴 明 环 ， 不 断 迭 代 试 验 ， 发 现 、 实 施 、 评 估 并 改善 方 
案 ， 直 到 达成 目标 状态 。 戴 明 环 ， 又 叫 PDCA 循 环 ， 是 由 美国 统计 学 家 戴 明 博士 提 
出 来 的 ， 它 反映 了 质量 管理 活动 的 规律 。P (Plan) 表示 计划 ，D (Do) 表示 执行 ， 
C (Check) 表示 检查 ，A (Action) 表示 处 理 。PDCA 循 环 是 提高 产品 质量 、 改 善 
企业 经 营 管理 的 重要 方法 ， 是 质量 保证 体系 运转 的 基本 方式 。 
这 种 “改善 套路 ”不 针对 任何 特定 领域 ， 是 一 种 普 适 方法 。 它 是 一 种 当 通 向 目标 的 
途径 不 确定 时 ， 用 以 达成 目标 的 通用 框架 和 一 组 例 行 实践 ， 可 以 直接 应 用 于 我 们 的 组 织 
改进 过 程 。 然 而 ， 它 并 没有 告诉 我 们 具体 该 做 什么 ， 因 此 我 们 必须 找到 一 些 线索 来 启动 


这 一 过 程 。 
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在 本 章 中 ,我 们 讨论 了 企业 采纳 持续 交付 所 需 的 文化 氛围， 并 根据 新 联合 汽车 公司 的 
案例 提取 了 建立 企业 文化 的 4 个 步 又 。 


4.6 小结 59 





。 第 一 步 : 定义 想 要 做 的 事情 。 

。 第 二 步 : 定义 期 望 的 做 事 方法 。 

。 第 三 步 : 提供 相应 的 培训 。 

。 第 四 步 : 做 些 必需 的 事情 来 强化 那些 行为 。 

与 此 同时 ， 为 了 提升 “持续 交付 2.0 能 力 ”， 企 业 或 组 织 应 该 遵守 3 个 行动 原则 ， 即 价 
值 导 向 、 快 速 验证 和 持续 学 习 。 同 时 ， 介 绍 了 持续 学 习 的 具体 方法 ， 如 迭代 回顾 、 复 盘 机 
制 等 。 我 们 也 讨论 了 组 织 度量 中 的 收益 与 风险 ， 并 强调 度量 的 目标 是 组 织 改 善 ， 而 非 个 体 
之 间 的 绩效 对 比 。 

企业 应 当 根 据 “ 改 善 套路 "， 在 设 定 目标 后 ， 从 简单 之 处 开始 行动 ， 通 过 不 断 优 化 ， 
达成 提升 “持续 交付 2.0 能 力 ” 的 目的 。 
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2000 年 ， 著 名 的 电 商 网 站 亚马逊 仍旧 是 传统 的 巨石 应 用 ， 而 不 是 今天 大 家 看 到 
十 的 微服 务 架构 。 这 种 巨石 应 用 每 次 部 署 时 必须 将 整个 网 站 作为 一 个 整体 统一 进 
行 部 署 。 在 大 型 促销 活动 期 间 ， 网 站 的 稳定 性 遇 到 了 严峻 挑战 。 尽 管 团 队 在 活动 之 前 做 了 
预 估 扩 容 ， 但 活动 期 间 的 流量 还 是 远 远 超出 了 团队 的 预期 。 生 产 事件 频 发 ， 常 向 修复 一 处 
问题 却 引 发 另 一 处 出 现 问题 。 
公司 管理 层 对 这 种 现象 进行 复 盘 ,并 认为 ， 最 主要 的 原因 是 系统 耦合 度 太 高 ， 比 较 复 
杂 。 但 是 ， 由 于 业务 需求 太 多 ， 时 间 比 较 紧 迫 ， 工 程 师 们 忙于 开发 自己 手 上 的 功能 特性 ， 
没有 时 间 进 行 沟 通 ， 了 解 系统 的 整体 架构 。 为 了 解决 这 一 问题 ， 工 程 师 们 应 该 在 开发 需求 
之 前 进行 更 加 充分 的 讨论 。 而 公司 CEO 贝 索 斯 却 认 为 到 不 应 当 再 增加 沟通 ， 而 是 应 该 减少 
沟通 ， 即 增加 小 团队 内 部 的 沟通 ,减少 团队 之 间 的 沟通 a 为 了 做 到 这 一 点 ， 应 该 将 网 站 的 
巨石 架构 全 面 改 造 为 面向 服务 架构 (Service-Oriented Aicfiitecture，SOA) ， 并 提出 以 下 要 
求 (参见 Steve Yegge 的 《程序 员 的 呐喊 》) 。 
(1) 所 有 的 团队 都 要 以 服务 接口 的 方式 ， 提 供 数据 和 各 种 功能 。 
(2) 团队 之 间 必 须 通 过 接口 来 通信 。 
(3) 不 允许 任何 其 他 形式 的 互 操作 : 不 允许 直接 读 取 其 他 团队 的 数据 ， 不 允许 共享 内 
存 ， 不 允许 任何 形式 的 后 门 。 唯 一 许可 的 通信 方式 ， 就 是 通过 网 络 调 用 服务 。 
(4) 具体 的 实现 技术 不 做 规定 ，HTTP、Corba、Pub/Sub 方 式 、 自 定义 协议 皆 可 。 
(5) 所 有 的 服务 接口 ,必须 从 一 开始 就 以 可 以 公开 为 设计 导向 , 没有 例外 。 这 就 是 说 ， 
在 设计 接口 的 时 候 ， 就 默认 这 个 接口 可 以 对 外 部 人 员 开 放 ， 没 有 讨价还价 的 余地 。 
(6) 如 果 不 遵守 上 面 规定 ， 就 会 被 解雇 。 
截至 2011 年 ， 其 生产 环境 的 部 署 频率 已 经 非常 高 了 。 工 作 日 的 部 署 频率 达到 了 平均 每 
11.6 秒 一 次 ， 一 小 时 内 最 高 部 署 次 数 达 到 了 1079 次 (参见 Jon Jenkins 在 O’Reilly Velocity 
Conference 2011 上 发 表 的 “Velocity Culture” ) 。 这 归功 于 将 巨石 应 用 改造 为 面向 服务 架构 
(SOA)。 由 此 可 见 ， 为 了 能 够 更 好 地 应 对 业务 发 展 ， 持 续 交 付 是 必然 趋势 ， 在 软件 系统 架 
构 方面 的 “大 系统 小 做 ”原则 是 促进 这 一 目标 达成 的 必要 条 件 。 
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5.1 “大 系统 小 做 ”原则 
5.1.1 持续 交付 架构 要 求 


为 了 提升 交付 速度 ， 获 得 持续 交付 能 力 ， 系 统 架 构 在 设计 时 应 该 考虑 如 下 因素 。 

(1) 为 测试 而 设计 (design fortest) 。 如 果 我 们 每 次 写 好 代码 以 后 ， 需 要 花费 很 大 的 精 
力 , 做 很 多 的 准备 工作 才能 对 它 进 行 测试 的 话 ， 那 么 从 写 好 代码 到 完成 质量 验证 就 需要 很 
长 周期 ， 当 然 无 法 快速 发 布 。 

(2) 为 部 署 而 设计 (design for deployment)。 如 果 我 们 开发 完 新 功能 ， 当 部 署 发 布 时 ， 
需要 花费 很 长 时 间 准 备 ， 其 至 需要 停机 才能 部 署 ， 当 然 就 无 法 快速 发 布 。 

(3) 为 监控 而 设计 (design for monitor)。 如 果 我 们 的 功能 上 线 以 后 ， 无 法 对 其 进行 监 
控 ， 出 了 问题 只 能 通过 用 户 反 馈 才 发 现 。 那 么 ， 持 续 交 付 的 收益 就 会 大 幅 降低 了 。 

(4) 为 扩展 而 设计 (design for scale) 。 这 里 的 扩展 性 指 两 个 方面 ， 一 是 支持 团队 成 员 
规模 的 扩展 ;二 是 支持 系统 自身 的 扩展 。 

(5) 为 失效 而 设计 (design for failure)。 俗 语 说 :“ 常 在 河 边 走 ， 哪 能 不 湿 鞋 。” 快 速 
地 部 署 发 布 总 会 遇 到 问题 。 因 此 ， 在 开发 软件 功能 之 前 ， 就 应 该 考虑 的 一 个 问题 是 : 一 旦 
部 署 或 发 布 失败 ， 如 何 优雅 且 快 速 地 处 理 。 


5.1.2 ”系统 拆 分 原则 


“大 系统 小 做 ”的 方法 由 来 已 入 ， 并 不 是 一 个 新 概念 。1971 年 ，David Parnas 发 表 了 一 
篇 题 为 “On the Criteria To Be Used in Decomposing Systems into Modules” (将 系统 分 解 为 
模块 的 标准 ) 的 论文 ， 讨 论 了 将 模块 化 作为 提高 系统 灵活 性 和 可 理解 性 同时 缩短 开发 时 间 
的 一 种 机 制 。 那 么 ， 对 今天 的 系统 架构 来 说 ,“ 大 系统 小 做 ”要 遵循 哪些 原则 呢 ? 

大 系统 应 该 由 很 多 组 件 (component) 或 服务 (service) 组 成 。 它们 通常 会 Cjar/war/dll/gem 
等 形式 出 现 ， 其 粒度 要 比 一 个 类 (class) 大 ,但 是 要 比 整个 系统 小 很 多 。 组 件 通 常 在 编译 
构建 或 者 部 署 时 被 集成 在 一 起 ， 而 服务 可 以 由 多 个 组 件 构 成 ， 能 够 独立 启动 运行 ， 并 在 运 
行 时 与 整个 系统 进行 通信 ， 成 为 整个 系统 的 一 个 组 成 部 分 。 根 据 David Parnas 的 论文 ， 结 合 
目前 软件 的 发 展 趋势 ， 以 及 持续 交付 的 要 求 ， 对 系统 进行 拆 分 有 以 下 几 个 原则 。 

(1) 作为 系统 的 一 部 分 ， 每 个 组 件 或 服务 有 清晰 的 业务 职责 ， 可 以 被 独立 修改 ， 甚 至 
被 另 一 种 实现 方案 所 替代 。 

(2)“ 高 内 聚 、 低 耦合 ” ， 使 整个 系统 易于 维护 ， 每 个 组 件 或 服务 只 知道 尽 可 能 少 的 信 
息 ， 完 成 相对 独立 的 单一 功能 。 

(3) 整个 系统 易于 构建 与 测试 。 将 系统 拆 分 后 ， 这 些 组 件 仍 需要 组 合 在 一 起 ， 为 用 户 
提供 服务 。 因 此 ， 如 果 构 建 和 测试 困难 ， 就 很 难 缩短 开发 周期 ， 无 法 达到 “持续 交付 ”这 
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一 目标 。 

(4) 使 团队 成 员 之 间 的 沟通 协作 更 加 顺畅 。 

当然 ， 这 种 拆 分 也 带 来 了 新 的 问题 。 例 如 ， 对 由 多 个 服务 组 成 的 系统 来 说 ， 一 个 请 求 
可 能 要 经 过 很 多 次 不 同 服务 之 间 的 相互 调用 才能 完成 ,调用 链 路 过 长 ， 当 有 成 百 上 千 的 服 
务 时 ,没有 服务 发 现 机 制 是 不 可 想象 的 ， 如果 代码 中 调用 了 他 人 的 服务 ， 则 查找 问题 的 难 
度 要 高 很 多 ， 除 非 有 统一 的 方式 在 沙 箱 里 运行 所 有 服务 ， 否 则 几乎 不 可 能 进行 任何 调试 。 
因此 ， 在 系统 拆 分 的 同时 ， 我 们 必须 同时 建立 相应 的 构建 、 测 试 与 部 署 和 监测 机 制 ， 
而 且 , 这 些 机 制 的 建立 与 系统 拆 分 工作 同等 重要 。 只 有 这 样 , 才能 既 获 得 系统 拆 分 的 益处 ， 
又 能 管理 因 拆 分 带 来 的 复杂 性 。 例 如 ， 谷 歌 公司 的 C++ 代码 统一 放 在 同一 个 代码 仓库 中 ， 
有 很 多 个 组 件 ， 且 这 些 组 件 之 间 有 很 多 依赖 关系 。 因 此 ， 公 司 内 部 开发 了 一 个 强大 的 编译 
构建 平台 〈 名 为 Bazel， 现 已 开源 ) ， 用 于 这 些 组 件 的 构建 。 


5.2 ”常见 架构 模式 


关于 与 软件 架构 相关 的 论著 已 经 有 很 多 了 ， 本 书 仅 讨论 其 中 的 3 种 架构 模式 : 一 是 微 
核 架 构 ， 常 用 于 需要 向 用 户 分 发 的 客户 端 软 件 ， 二 是 微服 务 架 构 ， 用 于 企业 自身 可 控 的 后 
台 服 务 端 软件 ， 三 是 分 层 的 巨石 应 用 ， 常 见于 创业 公司 的 产 咒 项目。 


5.2.1 微 核 架构 


微 核 架 构 (microcore architecture) 又 称 为 插件 架构 “(Plugin architecture) ， 指 的 是 软件 
的 核心 框架 相对 较 小 , 而 其 主要 业务 功能 和 业务 逻辑 都 通过 插件 实现 , 如 图 5-1 所 示 。 核心 
框架 部 分 通常 只 包含 系统 启动 运行 的 基础 功能 ,例如 基础 通信 模块 、 基 本 渲染 功能 和 界面 
整体 框架 等 。 插 件 则 是 互相 独立 的 ， 插 件 之 间 的 通信 中 通过 核心 框架 进行 ， 避免 出 现 互 相 
依赖 的 问题 。 

































































图 5-1 ” 微 核 架构 示意 图 
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这 种 架构 方式 的 优点 有 以 下 几 个 。 
。 良好 的 功能 延伸 性 〈extensibility) : 需要 什么 功能 ， 开 发 一 个 插件 即 可 。 
。 易 发 布 : 插件 可 以 独立 地 加 载 和 务 载 ， 使 它 比较 容易 发 布 。 
。 易 测 试 : 功能 之 间 是 隔离 的 ， 可 以 对 插件 进行 隔离 测试 。 
e 可 定制 性 高 : 适应 不 同 的 开发 需要 。 
e 可 以 渐进 式 地 开发 : 逐步 增加 功能 。 
当然 ， 它 也 有 不 足 ， 有 具体 有 以 下 几 点 : 
e 扩展 性 (scalability) 差 ， 内 核 通常 是 一 个 独立 单元 ， 不 容易 做 成 分 布 式 ， 但 对 客 
户 端 软件 来 说 ， 这 就 不 是 一 个 严重 问题 。 
e 开发 难度 相对 较 高 ， 因 为 涉及 插件 与 内 核 的 通信 ， 以 及 内 部 的 插件 登记 机 制 等 ， 
比较 复杂 。 
。 高 度 依赖 框架 ， 既 享受 框架 带 来 的 方便 性 ， 但 是 当 框 架 接口 升级 时 ， 也 可 能 会 影 
响 所 有 插件 ， 导 致 大 量 的 改造 工作 。 
基于 这 些 特点 , 我 们 将 其 用 于 对 客户 端 软 件 的 架构 改造 中 , 给 团队 的 持续 发 布 带 来 了 
巨大 的 收益 。 第 14 章 介绍 的 案例 进行 了 这 种 微 核 架 构 的 改造 ， 以 便 更 容易 在 保障 软件 质量 
的 情况 下 ， 同 时 提升 PC 客户 端 应 用 的 发 布 频率 。 


5.2.2 ”微服 务 架 构 


微服 务 架 构 (Microservice Architecture) 是 一 种 架构 模式 ， 它 提倡 将 单一 应 用 程序 划 
分 成 一 组 小 的 服务 ， 服 务 之 间 互 相 协调 、 互 相配 合 ， 为 用 户 提供 最 终 价 值 。 每 个 服务 运行 
在 其 独立 的 进程 中 ， 服 务 与 服务 间 采 用 轻 量 级 的 通信 机 制 互相 沟通 (通常 是 基于 HTTP 协 
议 的 RESTful API) 。 每 个 服务 都 围绕 着 具体 业务 进行 构建 ， 并 且 能 够 被 独立 地 部 署 到 生产 
环境 、 类 生产 环境 等 。 另 外 ， 应 当 尽 量 避 免 统 一 的 、 集 中 式 的 服务 管理 机 制 ， 对 具体 的 一 
个 服务 而 言 ， 应 根据 业务 上 下 文 ， 选 择 合适 的 语言 、 工 具 对 其 进行 构建 。 
这 种 软件 架构 的 优点 有 以 下 几 个 。 
e 扩展 性 好 一 一 各 个 服务 之 间 低 夸 合 。 可 以 对 其 中 的 个 别 服务 单独 扩容 ,如 图 5-2 所 示 
的 D 服 务 。 
e 易 部 署 一 一 每 个 服务 都 是 可 部 署 单元 。 
。 多 开发 一 -每 个 组 件 都 可 以 进行 单独 开发 ,单独 部 署 ， 不 间断 地 升级 。 
e。 易于 单独 测试 一 一 如 果 修 改 只 涉及 单一 服务 ， 那 么 只 测试 该 服务 即 可 。 
但 是 ， 它 也 有 不 足 ， 具 体 有 以 下 几 点 。 
e 由 于 强调 互相 独立 和 低 耦 合 ， 服 务 可 能 会 被 拆 分 得 很 细 。 这 导致 系统 依赖 大 量 的 
微服 务 ， 变 得 很 凑 乱 和 笨重 ， 网 络 通信 消耗 也 会 比较 大 。 
e 一 次 外 部 请 求 会 涉及 内 部 多 个 服务 之 间 的 通信 , 使 得 问题 的 调试 与 诊断 比较 困 












































HE 














64 ”第 5 章 持续 交付 的 软件 系统 架构 





需要 更 强大 的 工具 支持 。 
。 为 原子 操作 带 来 困难 ， 例 如 需要 事务 类 操作 的 场景 。 
。 跨 服 务 的 组 合 业务 场景 的 测试 比较 困难 ， 通 常 需要 同时 部 署 和 局 动 多 个 微服 务 。 
e 公共 类 库 的 升级 管理 比较 难 。 在 使 用 有 一 些 公共 的 工具 性 质 的 类 库 时 ， 需 要 在 构 
建 每 个 微服 务 时 都 将 其 打包 到 部 署 包 中 。 











图 5-2 ”根据 需求 单独 增加 微服 务 节点 D 
正 是 因为 这 些 困难 之 处 ,所 以 在 使 用 微服 务 架 构 模 式 时 ， 除 确保 每 个 服务 一 定 要 能 够 



































独立 部 署 之 外 ， 还 要 确保 在 部 署 升级 时 不 影响 其 下 游 服务 《例如 通过 支持 API 的 多 版 本 兼 
容 方式 )， 同 时 建立 全 面 的 微服 务 监测 体系 。 


5.2.3 ”巨石 应 用 


巨石 应 用 (monolithic application) 也 称 巨 石 架构 ,是 指 由 单一 结构 体 组 成 的 软件 应 用 ， 
其 用 户 接口 和 数据 访问 代码 都 绑 定 在 同一 语言 平台 的 同一 应 用 程序 。 术 语 monolith 通 常用 
来 描述 那些 由 采 自 大 地 中 的 单 块 大 岩石 筑 成 的 建筑 。 一 个 巨石 应 用 是 一 个 自我 完整 的 系 
统 ， 独 立 于 其 他 应 用 程序 。 其 设计 理念 就 是 自己 从 头 到 尾 完成 某 项 功能 所 需 的 所 有 步骤 ， 
而 不 只 是 实现 其 中 某 个 环节 。 这 种 巨石 架构 应 用 通常 表现 为 一 个 完整 的 包 ， 如 一 个 Jar 包 或 
者 一 个 Nodejs 或 Rails 的 完整 目录 结构 。 只 要 有 了 这 个 包 ， 就 什么 都 有 了 。 
组 织 良好 的 巨石 架构 同样 也 有 其 优势 ， 包 括 以 下 几 个 。 
e 利于 开发 和 调试 ， 当 前 所 有 开发 工具 和 IDE 都 很 好 地 支持 了 巨石 应 用 程序 的 开发 。 
系统 架构 简单 ， 调 试 方便 。 
e 部 署 操作 本 身 比较 简单 例如， 只 需要 有 运行 时 所 需 部 署 的 一 个 WAR 文 件 (或 目 
录 层 次 结构 ) 即 可 。 
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。 很 容易 扩展 : 只 要 在 负载 均衡 器 后 面 运行 这 个 应 用 的 多 个 副本 就 可 以 扩展 应 用 程序 。 
它 的 劣势 有 以 下 几 个 。 
。 对 整体 程序 不 熟悉 的 人 来 说 ， 容 易 产 生 混 乱 的 代码 ， 污染 整个 应 用 ， 给 老 代码 的 

学 习 和 理解 带 来 困难 。 
E 与 新 技术 共同 使 用 。 

。 只 能 将 整个 应 用 作为 一 个 整体 进行 扩展 (如 图 5-3 所 示 )。 

。 持续 部 署 非 常 困难 。 为 了 更 新 一 个 组 件 ， 必 须 重 新 部 署 整 个 应 用 程序 。 

对 创业 公司 或 者 中 小 型 项 目 来 说 ， 巨 石 应 用 可 以 快速 和 迭代， 不 需要 太 多 资产。 而且 对 
人 员 技 术 要 求 不 高 ， 常 常 单一 技术 栈 就 能 搞定 ， 人 力 资 源 容 易 获 取 。 
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ee ed ek) 





必须 作为 整体 
进行 扩展 


图 5-3 巨石 应 用 只 能 做 整体 扩展 

巨石 应 用 也 能 做 到 持续 交付 ， 但 是 需要 经 过 展 好 的 设计 。 例 如 ，2011 年 时 Facebook 公 
司 每 天 部 署 一 次 ， 而 这 个 部 署 包 约 1 GB 的 大 小 。 这 么 大 的 二 进 制 包 的 编译 时 间 也 仅 需要 二 
十 儿 分 钟 ， 将 其 全 部 分 发 到 近 万 台 机 器 上 ， 也 只 需要 不 到 两 分 钟 的 时 间 。 
事实 上 , 无 论 什么 样 的 架构 ,只 要 没有 针对 代码 的 整个 生命 周期 (开发 、 测 试 和 部 署 ) 
进行 良好 设计 ， 对 “快速 交付 ”来 说 ， 就 会 存在 困难 。 例 如 ， 国 内 某 互 联网 公司 开发 了 一 
个 微服 务 框架 ， 可 以 快速 开发 出 一 个 微服 务 ， 而 且 也 容易 部 署 。 然 而 ， 在 践 行 持续 交付 过 
程 中 ， 团 队 才 发 现 ， 这 个 微服 务 框架 在 多 人 并 行 开发 多 个 服务 的 升级 版 本 时 ， 开 发 的 调试 
过 程 和 测试 环节 都 遇 到 了 很 大 困难 。 原 来 ， 这 个 微服 务 框架 只 允许 一 个 主 控 服 务 存 在 ,而 
且 只 能 通过 服务 名 进行 服务 注册 与 发 现 ， 并 不 支持 同一 服务 的 多 个 版 本 同时 存在 。 当 两 个 
开发 人 员 同 时 开发 各 自 的 服务 模块 A 和 B 时 ， 由 于 服务 A 的 新 版 本 还 没有 开发 完成 ,因此 服 
务 B 需 要 使 用 服务 A 的 旧版 本 进行 联 调 。 但 是 ， 如果 将 服务 A 的 两 个 版 本 同时 部 署 到 开发 调 
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试 环境 中 ， 如 图 5-4a 所 示 ， 服 务 就 会 出 现 混乱 。 那 么 ， 如 果 我 们 同时 准备 两 个 调试 环境 ， 
分 别 部 署 两 个 主 控 服 务 ， 似 乎 是 可 行 的 ， 如 图 5-4b 所 示 。 但 这 只 是 两 个 开发 人 员 的 并 行 开 
发 场景 ， 如 果 是 多 人 并 行 开发 调试 ， 则 所 需要 的 资源 会 更 大 。 


























(A 测试 环境 ) 






服务 发 现 
服务 调用 








斌 还 党 


人 





(a) 服务 名 发 生 冲突 (b) 更 多 测试 环境 需要 更 多 资源 
图 5-4 ”没有 考虑 调试 环境 的 微服 务 框 架 

当然 ， 解 决 这 个 问题 还 有 其 他 办 法 。 例 如 ， 某 互联 网 公司 的 后 台 微 服务 数量 众多 ,很 
难为 每 一 个 开发 人 员 建 立 单独 的 一 套 济 试 环境 。 因此， 他们 开发 了 一 个 路 由 机 制 ， 在 同一 
套 测 试用 的 标准 微服 务 环 境 下 ， 开 发 人 员 可 以 单独 部 署 自己 正在 修改 的 微服 务 ， 并 通过 路 
由 机 制 ， 与 标准 微服 务 环 境 中 的 其 他 服务 形成 一 个 虚拟 的 微服 务 环境 ， 用 于 自己 调试 ， 如 


5-5 所 示 。 
修改 中 的 仿 
服务 A 
(标准 测试 环境 ) 


服务 X 
图 5-5 通过 路 由 机 制 建立 共享 的 微服 务 测试 环境 
5.3 ”架构 改造 实施 模式 

对 部 署 频率 较 低 的 遗留 系统 来 说 ， 很 少 会 仔细 考虑 易 测 试 、 易 部 署 和 易 扩 展 这 3 个 因 
素 。 为 了 保持 业务 的 敏捷 性 ， 软 件 架 构 也 需要 保持 敏捷 性 。 这 里 的 “敏捷 ”是 指 具 有 快速 
且 轻 松 做 出 改变 的 能 力 。 因 此 ， 我 们 总 会 遇 到 架构 改造 的 需求 。 通 常 ， 这 类 改造 有 3 种 实 
施 模式 ， 分 别 是 拆迁 者 模式 、 绥 杀 者 模式 和 修缮 者 模式 。 其 中 ， 绥 杀 者 模式 和 修缮 者 模式 
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都 有 利于 持续 交付 ， 降 低 架构 改造 和 发 布 的 风险 。 
5.3.1 ”拆迁 者 模式 


“拆迁 者 模式 ”就 是 指 根据 当前 的 业务 需求 ， 对 软件 架构 重新 设计 ， 并 组 织 单独 的 团 
队 ， 重 新 开发 一 个 全 新 的 版 本 ， 一 次 性 完全 替代 原 有 的 遗留 系统 ， 如 图 5-6 所 示 。 























图 5-6 ”拆迁 者 模式 


这 各 方式 的 好 处 在 于 ， 它 与 旧版 本 没有 瓜葛 没有 历史 包容 ， 可 以 按 预 期 进行 架构 设 
计 。 但 是 ， 这 种 模式 的 风险 包括 以 下 几 个 方面 。 

(1) 业务 需求 遗漏 。 软 件 的 历史 版 本 中 ， 有 很 多 不 为 人 熟知 的 功能 还 在 使 用 。 

(2) 市 场 环 境 变化 。 由 于 新 版 本 架构 无 法 一 跃 而 就 ， 当 市 场 需求 发 生变 化 时 ， 就 会 错 
失 市 场 良机 。 

(3) 人 力 资源 消耗 大 。 必 须 分 出 人 力 , 一 边 维 护 旧 版 本 的 功能 或 紧急 需求 ,一 边 要 安 
排 充分 人 力 进行 架构 改造 。 

(4)“ 闭 门 造 车 ”。 新 版 本 上 线 后 ， 无 法 满足 业务 需求 。 

当然 ， 并 不 是 说 这 种 模式 不 可 实施 。 惠 普 激光 打印 机 的 固件 架构 改造 项 目 就 是 一 个 架 
构 重 写 的 成 功 案例 (资料 来 源 : Gary Gruver 等 人 的 《大 规模 敏捷 开发 实践 : HP LaserJet 产 
品 线 敏捷 转型 的 成 功 经 验 》 一 书 )。2008 年 ， 该 团队 已 经 筋疲力尽 ， 整 个 团队 只 有 5% 的 人 
力 能 够 用 于 开发 新 特性 。 经 过 3 年 的 努力 ， 到 2011 年 ， 做 新 特性 开发 的 资源 提升 了 8 倍 ， 全 
部 研发 成 本 下 降 了 40%。 其 软件 架构 变 成 了 “ 微 核 ”架构 模式 ， 即 每 台 打 印 机 都 安装 有 一 
个 最 小 的 固件 初始 版 本 。 当 打印 机 联网 以 后 ， 该 固件 可 以 根据 实际 业务 需要 ， 从 网 络 下 载 
必要 的 功能 模块 ， 并 自动 部 署 安装 。 

在 架构 重 写 过 程 中 , 该 团队 同时 还 改变 了 原 有 的 分 支 模式 。 从 “分 支 地 狱 ” 转变 为 “ 主 
干 开发 模式 ”( 参 见 第 8 章 )， 并 建立 了 自己 的 持续 交付 部 署 流水 线 。 
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当然 , 这 么 做 也 有 失败 的 案例 。 网 景 通信 公司 (Netscape Communications Corporation ) 
是 一 家 美国 计算 机 服务 公司 ， 曾 以 其 生产 的 同名 网 页 浏览 器 Netscape Navigator 而 闻名 。 由 
于 其 老 旧 的 软件 架构 使 得 用 户 体验 越 来 越 差 ， 并 且 很 难 快速 应 对 互联 网 浏览 器 的 发 展 ， 于 
是 公司 高 层 决 定 使 用 拆迁 者 模式 对 软件 架构 进行 改造 。 在 此 期 间 ， 微 软 公司 凭借 下 浏览 器 
与 Windows 的 成 功 ， 一 跃 成 为 浏览 器 市 场 的 第 一 ， 而 网 景 公司 从 此 一 踊 不 振 。 


5.3.2 ” 绞 杀 者 模式 








“ 绞 杀 者 模式 ”是 指 保持 原来 的 遗留 系统 不 变 ， 当 需要 开发 新 的 功能 时 ， 重 新 开发 一 
个 服务 ， 实 现 新 的 功能 。 通 过 不 断 构建 新 的 服务 ， 逐 步 使 遗留 系统 失效 ， 并 最 终 替 代 它 ， 
如 图 $-7 所 示 。 














图 5-7” 绥 杀 者 模式 


这 种 方式 的 好 处 在 于 

。 不 会 遗漏 原 有 需求 ， 

。 可 以 稳定 地 提供 价值 ， 频 繁 地 交付 版 本 ， 可 以 让 你 更 好 地 监控 其 改造 进展 ; 
。 避免 “闭门造车 ”现象 。 

其 劣势 在 于 ; 

。 架构 改造 的 时 间 跨度 会 变 大 ， 

。 产生 一 定 的 选 代 成 本 。 


5.3.3 ”修缮 者 模式 


“修缮 者 模式 ”是 指 将 遗留 系统 的 部 分 功能 与 其 余部 分 隔离 ， 以 新 的 架构 进行 单独 改 
善 。 在 改善 的 同时 , 需要 保证 与 其 他 部 分 仍 能 协同 工作 ， 如 图 5-8 所 示 ， 上 面 的 步 又 与 我 们 
在 第 12 章 所 讲 的 抽象 分 支 技术 一 样 。 这 种 方式 与 绞 杀 者 模式 类 似 , 但 改造 只 发 生 在 同一 个 
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系统 内 部 ， 而 非 遗 留 系统 外 部 。 其 收益 包括 : 
。 系统 外 部 无 感知 ; 
e 不 会 遗漏 原 有 需求 ; 
e 可 以 随时 停 下 改造 工作 ， 响 应 高 优先 级 的 业务 需求 ， 
e 避免 “闭门造车 ”现象 。 
而 其 劣势 在 于 : 
e 架构 改造 的 时 间 跨 度 会 变 大 ， 
e 会 有 更 多 额外 的 架构 改造 迭代 成 本 。 


(by (€) (d) 


图 5-8 ”修缮 者 模式 


使 用 修缮 者 模式 将 巨石 应 用 向 微服 务 架 构 演进 时 , 最 后 应 将 分 离 出 来 的 部 分 独立 成 一 
个 新 的 服务 ， 如 图 5-9 所 示 。 要 将 接 缝 处 的 代码 研一 分 为 二 ， 其 中 属于 原 有 应 用 职责 的 怀 应 
留 在 原 有 的 巨石 应 用 中 ， 而 与 分 离 后 的 微服 务 紧密 相关 的 名 应 与 微服 务 结合 在 一 起 。 重 复 
这 个 步骤 ， 直 至 完成 所 有 微服 务 的 分 离 。 














(b) 


图 5-9 巨石 应 用 向 微服 务 的 改造 
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5.3.4 数据 库 的 拆 分 方法 





一 般 来 说 ， 关 系 型 数据 库 很 可 能 是 巨石 应 用 中 的 最 大 耦合 点 。 因 此 ， 对 于 有 状态 微服 
务 的 改造 ， 我 们 需要 非常 小 心地 处 理 数 据 库 数 据 。 做 数据 库 拆 分 时 ， 我 们 应 该 遵循 以 下 步 


又 ， 如 图 5$-10 所 示 。 


(1) 详细 了 解数 据 库 结 构 ， 包 括 外 键 约 束 、 共 享 的 可 变数 据 以 及 事务 性 边界 等 ， 如 图 


5-10a 所 示 。 








(2) 先 拆 分 数据 库 ， 并 按照 12.3.2 市 的 介绍 进行 数据 迁移 ， 如 图 5-10b 所 示 。 


(3) 数据 库 双 写 无 误 后 ， 找 到 程序 架构 中 的 缝 除 ， 如 








图 5-10c 所 示 。 


(4) 将 拆 分 出 来 的 程序 模块 和 数据 库 组 合 在 一 起 ， 形 成 微服 务 ， 如 图 5-10d 所 示 。 











(a) 数据 接 入 层 缝隙 (b) 分 出 数据 库 表 (ec) 找 出 服务 缝隙 


图 5-10 ”微服 务 改造 中 的 数据 库 拆 分 处 理 


(d) 分 出 有 状态 的 服务 





应 该 围绕 业务 目标 进行 架构 改造 
对 巨石 应 用 进行 拆 分 时 ， 可 以 先 拆 分 成 颗粒 度 相 对 较 大 的 服务 。 当 拆 分 完成 后 ， 如 
果 达 到 拆 分 的 目标 (如 已 支持 更 快 的 发 布 频 率 )， 那 么 就 可 以 停 下 来 了 ， 不 应 该 为 了 架构 
而 架构 ， 为 了 技术 而 技术 。 同 时 ， 还 需要 注意 的 是 ， 在 拆 分 成 微服 务 架构 时 ， 你 必须 考 
虑 要 建立 相应 的 基础 设施 ， 例 如 服务 治理 、 服 务 监控 、 自 动 化 测试 与 自动 化 部 署 等 工具 。 


5.4 小 结 


本 章 讨论 了 “持续 交付 2.0 能 力 ” 对 软件 系统 架构 的 要 求 ， 在 软件 开发 设计 时 就 考虑 





可 测试 性 、 易 部 署 性 、 易 监测 性 、 易 扩展 性 ， 以 及 对 可 能 失败 的 处 理 ， 并 且 讨 论 了 系统 架 
构 拆 分 原则 。 

我 们 也 对 常见 的 3 种 软件 架构 模式 及 其 适用 的 不 同 场景 进行 了 分 析 与 比较 。 例 如 ， 微 
核 架构 模式 适合 于 客户 端 软件 ， 微 服务 架构 模式 适合 于 大 型 后 台 服 务 端 系统 ; 巨石 应 用 则 
适合 于 创业 公司 或 中 小 型 项 目 。 

最 后 ， 我 们 讨论 了 对 遗留 系统 进 和 i 

(1) 拆迁 者 模式 ， 就 是 一 次 性 重 写 所 有 代码 。 人 熟悉 的 方式 。 

(2) 绞 杀 者 模式 ， 就 是 不 改变 或 少 改变 原 有 遗留 系统 ， 过 增加 新 的 服务 玉 不 断代 

(3) 修缮 者 模式 , 就 是 通过 迭代 , 对 原 有 遗留 系统 进行 逐步 改造 ， 同 时 开发 新 的 功能 

同时 , 也 介绍 了 如 何 解决 绞 杀 者 模式 和 修缮 者 模式 中 可 能 遇 到 数据 库 表 及 数据 的 拆 分 
和 迁移 问题 

为 了 能 够 持续 交付 ， 并 且 降 低 架 构 改造 的 风险 ， 建 议 团 队 根据 实际 情况 ， 采 用 绞 杀 者 
模式 或 修缮 者 模式 进行 遗留 系统 的 架构 改造 。 
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__ 款 产品 的 整个 生命 周期 可 以 分 成 以 下 5 个 阶段 ， 即 概念 阶段 、 旷 化 阶段 、 验 证 
阶段 、 运 营 阶 段 和 业务 退 市 阶段 。 每 个 阶段 的 时 间 周 期 不 国定 ， 甚 阶段 目标 也 
各 不 相同 。 概 念 阶 段 需要 清楚 回答 市 场 机 会 、 客 户 需求 的 紧迫 性 、 企 业 自 身 的 竞争 优势 、 
产品 的 可 行 性 以 及 自身 产品 团队 能 力 等 问题 。 孵 化 阶段 要 考察 产品 核心 功能 的 完善 度 、 满 
足 典 型 目标 用 户 的 核心 诉求 程度 ， 小 范围 试验 用 户 的 反馈 等 问题 。 验 证 阶段 则 主要 关注 最 
小 核心 功能 集 的 用 户 体验 、 早 期 用 户 的 反馈 、 鳃 利 模式 ， 以 及 产品 技术 核心 团队 的 稳定 性 
与 加 大 资源 投入 的 可 行 性 。 运 营 阶 段 则 主要 关注 市 场 环 境 变 化 、、 客 户 泛 化 需求 的 存在 性 ， 
以 及 投入 产 出 比 等 。 一 旦 这 些 要 素 不 满足 企业 的 预期 -就 应 该 考虑 产品 的 退 市 步骤 了 。 
除 概 念 阶段 以 外 ， 每 个 阶段 都 至 少 包含 一 个 产品 版 本 周期 ， 如 图 6-1 所 示 。 

















多 个 产品 版 本 周期 


概念 阶段 孵化 阶段 验证 阶段 运营 阶段 退 市 阶段 
图 6-1 产品 全 生命 周期 的 5 个 阶段 

在 每 个 产品 版 本 周期 中 ， 又 分 为 准备 期 和 交付 期 。 它 们 由 多 个 迭代 构成 ， 每 个 迭代 至 
少 包含 一 个 持续 交付 “8” 字 环 ， 用 于 解决 一 个 (或 一 组 ) 业务 领域 问题 ， 如 图 6-2 所 示 。 














< 聚焦 PE 
发 散 ~、 执行 验证 
起 入 探索 + 验证 探索 + 验证 探索 + 验证 探索 + 验证 
业务 问题 上 术 寺 十 拉 焉 - 休 寺 + 给 让 术 和 十 


一 人 一 


准备 期 交付 期 
图 6-2 ”单个 产品 版 本 周期 的 组 成 
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业务 需求 协作 管理 贯穿 于 整个 软件 产品 版 本 周期 , 涉及 与 业务 软件 交付 相关 的 所 有 角 
色 ， 包 括 业 务 人 员 、 产 品 及 运营 人 员 、 开 发 人 员 、 测 试 人 员 和 运 维 人 员 等 。 其 目标 是 通过 
改善 各 角色 在 持续 交付 “8” 字 环 各 环节 中 的 交互 协作 流程 ， 有 效 且 高 效 地 完成 业务 问题 
的 分 析 、 业 务 方案 的 实施 和 结果 验证 工作 ， 并 确保 所 有 需求 不 遗漏 ， 被 完整 跟踪 。 


6.1 产品 版 本 周期 概述 


一 个 产品 版 本 周期 包含 准备 期 和 交付 期 。 准备 期 的 目标 是 让 参与 该 产品 版 本 周期 的 所 
有 角色 对 期 望 解决 的 业务 问题 以 及 最 小 可 行 解决 方案 达成 共识 。 交 付 期 的 目标 是 通过 快速 
迁 代 ， 最 终 验 证 或 解决 该 业务 问题 。 


6.1.1 准备 期 


准备 期 是 团队 成 员 共 同 探索 发 现 与 决策 的 过 程 , 核心 任务 是 达成 业务 理解 与 目标 的 共 
识 。 它 是 一 个 先 发 散 再 聚焦 的 过 程 ， 从 最 初 要 解决 的 业务 领域 问题 出 发 ， 业 务 人 员 、 产 品 
研发 运 维 团队 在 一 起 研讨 , 共同 了 解 和 认识 业务 问题 的 全 貌 , 并 定义 业务 目标 与 衡量 指标 ， 
找 出 所 有 的 可 能 性 解决 方案 ， 再 通过 精炼 手段 ， 从 这 些 备 选 解决 方案 中 挑选 并 制订 出 最 小 
可 行 试验 方案 。 有 时 候 ， 人 们 会 将 这 个 准备 期 称 为 “ 返 代 0 ”， 或 者 “启动 期 。 

准备 期 的 参与 者 通常 包括 有 决策 权 的 业务 方 各 角色 代表 与 IT 方 各 角色 代表 , 因为 进入 
交付 期 之 前 需要 对 最 小 可 行 解决 方案 达成 共识 ， 做 出 决策 。 另 外 ， 在 条 件 允 许 的 情况 下 ， 
尽 可 能 保证 准备 期 的 参与 者 能 够 参与 交付 期 的 工作 , 至 少 应 该 保证 准备 期 的 主要 参与 者 能 
够 参与 。 只 有 这 样 ， 才 能 将 业务 领域 知识 与 决策 上 下 文 有 效 地 带 入 交付 期 ,使 交付 期 中 的 
相关 决策 也 能 更 加 准确 。 

一 般 来 说 ， 准 备 期 不 但 要 有 最 小 可 行 解决 方案 ,还 要 回答 “ 它 大 约 需 要 多 久 才 能 执行 
并 验证 完成 2”。 这 是 产品 版 本 周期 中 的 关键 决策 点 。 迭 代 准 备 期 最 终 需 要 对 最 小 可 行 解决 
方案 及 初步 交付 计划 达成 共识 。 这 个 初步 交付 计划 并 不 要 求 十 分 精确 ， 只 要 能 够 支持 管理 
者 做 出 决策 即 可 。 

准备 期 的 主要 工作 内 容 包括 : 

(1) 目标 阐述 与 理解 : 业务 代表 讲解 当前 这 个 产品 版 本 周期 内 所 需 达 成 的 重要 业务 目 
标 ， 以 及 相关 的 业务 上 下 文 。 参 与 者 应 积极 参与 互动 ， 以 便 充分 理解 业务 ， 

(2) 业务 领域 角色 与 流程 识别 ， 及 解决 方案 的 探索 : 全 体 参与 者 共同 讨论 并 识别 该 业 
务 问 题 所 涉及 的 主要 业务 流程 与 流程 中 的 业务 角色 ， 并 找到 尽 可 能 多 的 解决 方案 ; 

(3) 重大 风险 识别 与 验证 : 识别 各 种 方案 中 的 业务 与 技术 风险 ,并 且 组 织 人 员 对 那些 
影响 决策 的 重大 风险 进行 快速 验证 ， 

(4) 精炼 并 达成 最 小 可 行 方案 共识 : 从 众多 的 解决 方案 中 挑选 并 制订 最 小 可 行 解决 
方案 ; 
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(5) 评估 与 计划 : 对 最 小 可 行 解决 方案 进行 初步 的 工作 量 与 时 间 评 估 ， 制 订 相 应 的 交 
付 计划 。 

由 于 方案 的 复杂 度 不 同 ， 选 代 准 备 期 的 时 长 也 有 所 不 同 。 对 一 个 成 熟 且 协作 流 帕 的 团 
队 来 说 , 这 个 准备 期 可 能 很 短 , 如果 紧 密 协 作 ， 没 有 其 他 事情 干扰 , 则 仅 需 要 一 周 的 时 间 。 


6.1.2 ”交付 期 


一 旦 对 准备 期 得 出 的 初步 计划 达成 共识 以 后 , 团队 即 可 进入 交付 期 。 交付 期 也 由 多 个 
迭代 组 成 ， 各 迭代 周期 应 尽量 保持 一 致 。 每 个 迭代 中 可 能 包含 多 个 持续 交付 “8” 字 环 ， 
这 主要 取决 于 每 个 迭代 中 是 否 包括 多 个 业务 验证 点 ， 以 及 与 每 个 验证 点 相对 应 的 解决 方案 
实现 难度 与 验证 周期 ， 如 图 6-2 所 示 。 

有 些 团队 采用 迭代 开发 方法 ， 其 做 法 是 : 将 原来 的 一 个 大 瀑布 研发 流程 ， 改 进 为 多 个 
小 瀑布 研发 流程 ， 如 图 6-3 所 示 。 在 每 个 迭代 的 开始 , 所 有 团队 成 员 在 一 个 会 议 室 里 进行 当 
前 友 代 需求 的 分 析 与 讨论 ， 然 后 马上 局 动 开发 工作 。 在 迭代 前 半期 ， 几 乎 没有 需求 开发 完 
成 ， 而 到 了 和 迭代 后 期 ， 大 量 需 求 几乎 同时 完成 ， 同 时 提 测 。 这 种 方式 的 不 足 在 于 ， 团 队 成 
员 对 当前 迭代 的 需求 分 析 不 充分 ， 容 易 出 现 后 期 返 于 现象 。 同 时 ， 也 容易 形成 迭代 后 期 集 
中 测试 的 现象 。 这 并 非 “持续 交付 2.0” 所 期 望 的 连续 快速 流动 。 




















迭代 N | 迁 代 NM 


图 6-3 ”迭代 中 的 小 波浪 交付 


困 队 应 该 在 当前 迭代 刚刚 开始 后 ， 立 即 着手 对 后 续 和 迭代 要 开发 的 需求 进行 详细 分 析 ， 
并 在 下 一 个 迭代 开始 前 ， 确 保 所 有 参与 者 对 需求 的 验收 条 件 理 解 一 致 ， 达 成 共识 。 提 前 进 
行 需求 分 析 的 收益 有 两 点 : 一 是 更 早 发 现 还 存在 风险 的 需求 ， 提 前 进行 沟通 和 准备 ; 二 是 
一 旦 提前 完成 了 当前 和 迭代 的 内 容 ， 可 以 从 下 个 迭代 需求 列表 中 选择 一 些 需 求 进行 开发 ， 没 
有 间断 。 在 这 种 情况 下 ， 有 一 些 需 求 可 能 会 栅 跨 两 个 欠 代 ， 如 图 6-4 所 示 。 











! B BE. | 

| 人 ee 人 人 
ss A C 
需求 EC 一 一 一 纪 D 一 一 一 + 丰 F 

| © : 1 © 


一 时 门 
选 代 X-1 选 代 N 迭代 M+1 
图 6-4” 跨 迭代 的 需求 连续 开发 


在 这 种 运行 模式 下 ， 每 个 角色 在 同一 个 迭代 中 会 有 多 种 任务 。 例 如 ， 产 品 人 员 需 要 : 
(1) 及 时 回答 其 他 角色 对 本 次 欠 代 需求 提出 的 疑问 ， 
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(2) 及 时 验收 在 本 运 代 中 完成 的 需求 ， 

(3) 组 织 其 他 角色 ， 为 准备 后 续 迭 代 的 内 容 进 行 需求 筛选 与 分 析 。 

开发 人 员 需 要 : 

(1) 开发 当前 迭代 中 的 需求 ; 

(2) 及 时 修复 测试 人 员 发 现 的 缺陷 ， 

(3) 参与 后 续 迭 代 的 需求 分 析 与 用 例 评 审 。 

测试 人 员 需 要 : 

(1) 及 时 验收 刚刚 开发 完成 的 需求 ， 

(2) 验收 已 被 修复 的 缺陷 ， 

(3) 参与 后 续 磷 代 的 需求 分 析 ， 并 对 其 进行 测试 用 例 分 析 ， 组 织 测 试用 例 评审 。 

同时 ， 开 发 人 员 与 测试 人 员 还 要 应 对 生产 环境 出 现 的 问题 ， 及 时 进行 分 析 与 解决 。 

每 个 从 代 结束 时 ， 团 队 都 应 该 交付 质量 达标 的 可 工作 软件 ,而且 应 当 不 断 追 求 “ 持 续 
交付 2.0 能 力 ” 的 提升 , 做 到 “即便 在 达 代 过 程 中 , 也 能 够 随时 交付 质量 达标 的 可 工作 软件 ”， 
实现 需求 的 持续 流动 。 


6.2 ”需求 拆 分 的 利 与 贞 


传统 瀑布 软件 开发 方法 中 , 工作 任务 的 分 解 根据 活动 阶段 来 拆 分 , 例如 需求 分 析 工 作 、 
概要 设计 工作 、 详 细 设 计 工 作 、 编 码 工作 、 集 成 测试 工作 等 。 然 后 对 每 个 阶段 的 工作 任务 
再 进行 分 解 ， 如 不 同 模块 的 需求 分 析 、 概 要 设计 、 编 码 和 调试 任务 等 ， 如 图 6-5 所 示 。 














需求 规格 设计 尚未 验证 的 可 运行 的 。 可 交付 的 
说 明 书 说 明 书 。 ”代码 代码 软件 
1 1 1 1 
需求 分 | 设计 | 开发 | 联 调 ! 测试 ， 
ER 本 
[ 子 系统 A 架 构 设计 | [ER | 模块 AVA; 联 调 | /A, 联 调 
子 系统 A 需求 
藉 统 总 需求 | 帮 系 统 B 需 求 | [ 承 统 总 体 设 诈 子 系 统 B 架 构 设计 ] 人 [模块 BVB: 联 调 ] [系统 联 调 [集成 测 记 
子 系统 C 需 求 





一 模块 C 开 发 
子 系统 C 架 构 设计 二 [ 栈 块 CVC: 联 调 ] 


图 6-5 ”传统 瀑布 开发 方法 的 任务 分 解 模式 
这 种 工作 任务 的 拆 分 方式 使 得 只 有 项 目 在 进入 测试 阶段 时 , 各 模块 才 放 在 一 起 进行 联 
调 。 这 经 常 导致 联 调 和 调试 阶段 发 现 缺 陷 较 多 ， 延 期 风险 很 高 。 另 外 ， 由 于 整个 交付 周期 
太 长 ， 也 容易 出 现下 面 两 种 情况 : (1) 只 有 当 业 务 方 看 到 软件 时 ， 才 发 现 与 业务 预期 不 一 
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致 ， (2) 由 于 市 场 变化 或 业务 快速 发 展 ， 刚 刚 实 现 的 软件 已 无 法 满足 当前 的 实际 需求 了 。 
因此 ， 应 该 放弃 这 种 工作 分 解 方式 。 

我 们 应 该 尽 可 能 从 业务 视角 出 发 ， 将 大 块 的 业务 功能 需求 (如 图 6-6 中 的 总 需求 ) 再 
次 拆 分 成 多 个 小 的 业务 功能 需求 a、b1!、b2……x,)， 并 从 用 户 视角 来 描述 它 ， 以 提醒 所 
有 人 关注 其 业务 价值 ,对 这 些小 需求 进行 评估 和 优先 级 排序 后 , 团队 再 分 批 进行 迭代 交付 。 
这 种 方式 让 团队 能 够 尽早 得 到 可 运行 的 软件 ， 并 让 业务 人 员 能 够 看 到 业务 功能 的 进展 ， 以 

















便 与 软件 工程 师 询 通 ， 提 前 发 现 需求 理解 不 一 致 等 问题 。 同 时 ， 还 可 以 灵活 应 对 临时 的 需 
求 更 改 ， 响 应 市 场 的 快速 变化 。 利 于 持续 交付 的 需求 拆 分 总 原则 就 是 :“ 坚 持 以 业务 视角 
对 需求 进行 分 解 。 


第 一 批 用 户 故事 第 二 批 用 户 故 事 第 N 批 用 户 故 事 
[d ~----- | 











ee 
OO 
1 ! 可 交付 的 软件 ;可 交付 的 软件 ! 可 交付 的 软件 
需求 拆 分 成 用 户 故事 ”架构 概要 设计 ， ! 包 含 上 述 功 能 ! 包 含 上 述 功 能 ! 包 含 上 述 功能 
y ”和 迭代 1 - 迭代 > 迭代 ms 时 间 
准备 期 交付 期 














图 6-6 “从 业务 视角 进行 需求 拆 分 


6.2.1 需求 拆 分 的 收益 


拆 分 后 的 细 粒 度 需 求 可 以 让 团队 更 早 地 进行 集成 和 质量 验证 工作 , 及 时 发 现 次 在 的 问 
题 与 缺陷 ， 并 在 每 个 迭代 结束 时 都 能 够 得 到 包含 相应 功能 的 可 交付 软件 。 

1. 建立 共识 ， 协 调 工作 

在 传统 开发 方法 中 , 需求 文档 的 撰写 通常 由 业务 分 析 师 或 产品 经 理 完成 。 当 撰写 完成 
之 后 ， 产 品 经 理 才 会 叫 上 相关 的 技术 人 员 ， 召 开 需 求 评审 会 议 。 这 种 方式 有 两 个 环 端 。 一 
方面 ， 面 对 大 量 的 文档 描述 ， 团 队 仪 在 评审 会 议 的 这 一 两 个 小 时 内 ， 很 难 对 需求 内 容 进行 
较 充 分 的 讨论 ， 通 常 只 能 由 产品 经 理 宣读 一 遍 文档 ， 可 能 会 遗漏 很 多 风险 项 。 另 一 方面 ， 

旦 发 现 一 些 棘手 的 需求 疑问 ， 产品 经 理 也 很 难 在 评审 会 上 及 时 回答 。 由 于 给 予 开 发 人 员 

与 测试 人 员 思 考 时 间 较 少 ， 也 常会 有 图 6-7a 所 示 的 状况 发 生 ， 即 所 有 角色 都 认为 对 需求 的 
理解 已 经 达成 了 一 致 ， 但 事实 上 ， 每 个 人 的 理解 都 各 不 相同 。 

持续 交付 模式 下 ， 对 需求 提前 进行 拆 分 。 在 拆 分 时 ， 与 该 需求 相关 的 所 有 角色 均 需 参 
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与 。 每 个 需求 的 边界 上 下 文 都 应 被 充分 讨论 ， 从 而 让 各 角色 对 该 需求 的 目标 、 质 量 标准 和 
验收 条 件 达 成 一 致 。 事 实 上 ， 这 个 需求 拆 分 过 程 是 各 角色 知识 互补 ， 共 同 对 该 业务 领域 进 
行 需求 建 模 的 过 程 。 通 过 这 一 过 程 ， 团 队 对 需求 的 理解 达成 图 6-7b 所 示 的 状态 。 


我 们 达成 一 致 了 ! 我 们 达成 一 致 了 ! 


J ea wy ve 

dt > 本 TAN CN :Os 

下 上 ~ ~ 

+ 7 ‘ |]; 和 »/ Cr 
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和 Ly 沪 
图 6-7 真正 达成 一 致 


很 多 团队 希望 节省 时 间 ， 总 是 匆忙 启动 开发 工作 ， 然 而 ， 在 开发 过 程 中 和 验证 过 程 中 
经 常 遇 到 需求 理解 不 一 致 ， 或 者 异常 场景 考虑 不 全 ， 导 致 在 过 程 中 反复 讨论 确认 的 现象 。 
很 多 时 候 并 没有 市 省 时 间 ， 与 此 相反 ， 带 来 了 一 些 不 必要 的 浪费 ， 如 打 断 他 人 的 工作 、 频 
繁 进行 工作 任务 的 转换 等 。 

2. 小 批量 交付 ， 加 速 价值 流动 

当 我 们 将 较 大 的 需求 进行 拆 分 之 后 ,就 能 够 进行 小 批量 开发 和 测试 ， 从 而 尽早 地 交付 
软件 ， 让 用 户 更 早 地 使 用 软件 。 为 了 说 明 小 批 交 付 的 收益 ,我 们 先 简化 价值 模型 如 下 : 某 
软件 项 目 包 括 10 个 需求 ， 每 个 需求 需要 开发 10 天 ， 质 量 验 证 完成 需要 2 天 。 而 每 个 功能 交 
付 后 , 每 天 产生 价值 1000 美 元 。 那 么 两 种 不 同方 式 的 价值 流动 速度 如 表 6-1 所 示 , 小 批量 交 
付 在 第 120 天 已 产生 累计 价值 48 万 美元 ， 而 整 批 交付 却 收 益 为 0 美元 。 
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bos 











表 6-1 整 批 交付 与 小 批量 交付 的 价值 累计 对 比 




















整 批 交付 小 批量 交付 
和 (一 次 交付 10 个 功能 ) (每 两 个 功能 为 一 个 交付 批 次 ) 
第 24 天 (时 ki 

第 48 天 (A 4.8 万 美元 

第 72 天 0 美元 14.4 万 美元 

第 96 天 0 美元 28.8 万 美元 

第 120 天 0 美元 48 万 美元 











3. 低 成 本 拥抱 变化 

在 分 批 交付 过 程 上 , 一 旦 在 开发 过 程 中 遇 到 突 发 情况 (例如 市 场 需求 发 生 了 变化 , 需 
要 插入 更 高 优先 级 的 需求 )， 团队 可 以 快速 将 手中 的 任务 完成 (或 放弃 )， 然后 投入 新 插入 
的 高 优先 级 需求 。 如 图 6-8 所 示 ， 当 在 第 72 天 新 加 入 高 优先 级 需求 时 , 我 们 就 可 以 移 除 原 有 
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的 需求 内 容 ， 之 前 已 交付 的 工作 不 受 影 响 。 


Ci 


Ls 


迭代 交付 计划 
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移 除 原 计划 的 需求 





图 6-8 ”高 优先 级 需求 置换 


4. 多 次 集成 ， 及 时 反馈 质量 

即便 小 批量 需求 开发 完成 后 无 法 马上 交付 给 用 户 , 我 们 也 可 以 进行 联 调 与 测试 。 如 果 
此 时 发 现 软件 缺陷 ， 则 可 以 及 早 修复 。 假 如 发 现 的 缺陷 过 多 ， 可 能 有 3 种 原因 : 一 是 开发 
人 员 对 需求 理解 尚 不 到 位 ;二 是 研发 质量 标准 没有 得 到 很 好 的 贯彻 执行 ， 三 是 团队 成 员 之 
间 沟 通 不 充分 , 有 很 多 误 报 现象 (如 测试 人 员 认为 某 个 问题 是 缺陷 , 开发 人 员 则 认为 不 是 )。 
无 论 是 哪 一 种 原因 ， 与 大 批量 集中 开发 相 比 ， 我 们 都 已 提前 掌握 了 质量 反馈 ， 此 时 可 以 根 
据 真实 情况 ， 做 出 相应 的 工作 调整 ， 而 不 必 等 到 软件 开发 的 后 期 才 发 现 这 些 问题 。 

5. 鼓舞 团队 士气 

如 果 每 个 迭代 开发 的 新 功能 都 立即 被 用 户 使 用 , 并且 得 到 反馈 ,团队 就 会 受到 鼓舞 (无 
论 是 点 赞 ， 还 是 吐槽 ) 。 因 为 团队 成 员 知道 ， 用 户 正 在 使 用 他 们 的 产品 ， 而 且 还 能 够 对 产 
品 提出 建议 或 意见 。 


6.2.2 需求 拆 分 的 成 本 


当然 , 需求 拆 分 和 迭代 开发 不 仅 产 生 收 益 ， 还 会 产生 一 些 额外 的 成 本 。 下 面 我 们 就 来 
简单 分 析 一 下 。 
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1. 需求 拆 分 时 的 显 式 成 本 
通常 产品 需求 由 产品 经 理 (或 业务 分 析 师 ) 收集 并 撰写 成 文 ， 而 这 些 角色 通常 不 具备 
深厚 的 技术 背景 ， 仅 由 他 们 进行 需求 拆 分， 无 法 达成 最 佳 效果 。 因 此 ， 将 其 他 角色 卷 人 这 
个 需求 拆 分 的 过 程 ， 一 同 参与 和 确认 是 非常 必要 的 。 但 这 种 做 法 与 瀑布 开发 方法 相 比 ， 显 
然 在 项 目前 期 会 增加 更 多 的 沟通 成 本 。 
分 批 开发 、 测 试 和 部 署 的 迭代 成 本 

需求 拆 分 的 一 个 重要 目标 是 分 批 迁 代 交付 。 为 了 达到 交付 质量 ， 每 个 迭代 结束 之 前 ， 
都 要 进行 验证 ， 以 确保 已 经 交付 的 所 有 软件 功能 〈 包 括 前 面 几 个 迭代 交付 的 功能 ) 正确 运 
行 。 由 于 验证 次 数 增多 ， 因 此 验证 投入 成 本 也 会 增加 。 

如 果 每 个 欠 代 都 要 将 开发 完成 的 软件 部 署 到 生产 环境 中 , 那么， 还 会 增加 数 次 的 部 署 
成 本 〈 包 括 人 力 和 时 间 成 本 )。 如 果 需 要 停机 才能 进行 部 署 ， ee 
所 产生 的 收益 损失 ， 如 图 6-9 所 示 。 
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图 6-9 ”和 迭代 产生 的 固定 成 本 


尽管 妈 代 开发 的 收益 很 容易 被 人 理解 ， 但 并 不 容易 被 衡量 。 可 是 ， 和 迭代 产生 的 固定 成 
本 却 一 目 了 然 。 因 此 ， 决 定 迭 代 周 期 的 长 短 时 ， 也 会 需要 考虑 迭代 的 固定 成 本 。 我 们 从 第 
7 章 开 始 ， 将 陆续 介绍 一 些 方法 ， 用 于 降低 友 代 成 本 。 


6.3 ”需求 拆 分 方法 


尽管 我 们 在 准备 期 结束 后 ,已 经 得 到 了 最 小 可 行 解决 方案 的 一 个 需求 列表 , 但 是 ， 列 
表 中 的 需求 并 非 粒 度 足 够 细 ， 而 且 也 不 一 定 完 全 明确 以 直接 指导 开发 工作 。 因 此 ， 我 们 要 
以 “渐进 明晰 ”为 原则 ， 每 个 迭代 都 应 该 做 一 些 需求 分 析 与 细 化 工作 。 

另外 ,整体 需求 列表 中 , 是否 应 该 只 包含 业务 人 员 提 出 的 需求 呢 ?” 还 有 其 他 需求 来 源 
吗 ? 进入 交付 期 后 ， ee a 每 个 需求 应 该 详细 到 什么 程度 呢 ? 如 何 
保证 需求 既 按 业务 导向 拆 分 ， 又 能 够 足够 小 呢 ? 接 下 来 ， 我 们 就 讨论 这 些 内 容 。 
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6.3.1 需求 的 来 源 


最 开始 的 业务 需求 列表 通常 是 根据 业务 人 员 提 出 的 需求 形成 的 ， 但 随 着 讨论 的 深入 ， 
我 们 还 会 发 现 业 务 人 员 没 有 意识 到 的 潜在 需求 。 正 如 空气 和 水 ,通常 你 不 会 意识 到 它们 的 
存在 ， 但 是 它们 一 旦 缺失 ， 就 会 对 人 的 生存 产生 威胁 。 在 软件 技术 领域 常 被 提 及 的 非 功能 
需求 就 属于 其 中 的 一 类 ， 例 如 性 能 要 求 、 易 用 性 要 求 、 响 应 延迟 等 ， 当 然 还 有 生产 环境 的 
各 类 监测 需求 、 系 统 灵活 配置 需求 等 。 因 此 ， 在 进入 交付 期 乙 前 ， 最 小 可 行 解决 方案 的 需 
求 列表 中 ， 需 求 来 源 由 以 下 3 部 分 组 成 。 

(1) 业务 人 员 提 出 的 业务 功能 需求 。 这 些 业 务 需求 构成 了 整个 产品 版 本 的 基础 需求 。 

(2) 为 了 保障 业务 需求 的 实现 与 运行 而 必须 满足 的 非 业 务 功能 需求 , 例如 因 页 面 响应 
时 间 要 求 而 产生 的 性 能 需求 、 因 成 本 控制 而 产生 的 自动 缩 扩容 要 求 等 。 

(3) 符合 安全 合 规 性 而 产生 的 安全 开发 需求 。 

在 进入 交付 期 之 后 ， 每 个 迭代 的 需求 列表 中 ， 其 需求 来 源 则 可 以 包括 以 下 7 个 部 分 。 

(1) 从 原始 需求 列表 中 选 出 的 待 实现 需求 。 

(2) 在 需求 细 化 过 程 中 新 发 现 的 需求 。 

(3) 已 知 且 需要 修复 的 线 上 生产 系统 缺陷 。 

(4) 线 上 技术 运营 需求 。 

(5) 前 期 预 研 需求 ， 它 是 指 团 队 目 前 尚 不 具备 能 力 7 但 为 了 实现 某 一 业务 需求 而 做 的 
准备 工作 。 

(6) 技术 债 需求 ， 它 们 是 指 因 早期 业务 进度 压力 而 积累 的 技术 债 改进 需求 。 

(7) 辅助 测试 需求 ， 为 了 便于 进行 需求 验收 ， 需 要 开发 的 测试 辅助 工具 。 


6.3.2 ”技术 债 也 是 需求 


技术 债 是 1992 年 由 Ward Cunningham (wiki 创始 人 ) 提出 来 的 一 个 概念 。 它 是 指 技术 
困 队 在 设计 架构 或 者 开发 的 过 程 中 ， 基 于 短期 目标 选择 了 一 个 方便 实现 的 方案 ， 而 从 长 远 
考虑 ， 这 种 方案 会 带 来 长 久 的 消极 影响 。 它 就 像 金融 债务 一 样 ， 如 果 没 有 恰当 管理 ， 累 计 
的 利息 可 能 就 会 把 你 压 跨 。 

然而 ， 技 术 债 通常 隐藏 很 深 ,， 没 人 会 主动 去 触 碰 当前 看 似 完 美的 系统 。 当 技术 债务 累 
积 到 一 定 程度 ， 严重 拖 慢 软件 开发 速度 时 才 会 被 人 注意 到 ， 此 时 软件 很 可 能 已 经 处 于 月 江 
的 状态 ， 只 能 投入 更 大 的 成 本 (时 间 与 资源 ) 来 修复 这 些 “ 债 务 ”。 

技术 债 产生 的 原因 有 以 下 两 个 。 

(1) 满足 眼前 需求 ， 没 有 更 进一步 考虑 。 即 使 后 续 增加 功能 也 没有 进行 适当 重 构 。 

(2) 低 质量 代码 (最 简单 的 表现 是 硬 编码 、 魔 术 数 字 、 混 乱 的 命名 、 重 复 代 码 、 较 高 
的 代码 圈 复 杂 度 ) 。 这 些 都 属于 与 代码 相关 的 技术 债 。 
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对 持续 交付 模式 来 说 ， 还 有 另外 一 种 “技术 债 ”， 即 影响 软件 交付 速度 或 业务 响应 速 
度 的 所 有 重复 性 且 需 要 花费 较 长 时 间 的 手工 操作 , 例如 手工 准备 测试 环境 、 手 工 回归 测试 、 
手工 部 署 与 发 布 等 。 之 所 以 定义 这 类 操作 为 技术 债 ， 是 因为 它们 在 很 大 程度 上 都 可 以 使 用 
技术 方式 进行 自动 化 ， 闻 省 大 量 的 人 工时 间 。 例 如 ， 在 很 多 互联 网 公司 中 ， 当 新 功能 上 线 
后 ， 产 品 运 营 人 员 根本 无 法 迅速 拿 到 用 户 的 行为 数据 。 他 们 必须 提出 统计 需求 ， 交 由 技术 
人 员 编 写 脚本 后 再 去 执行 , 通常 在 两 三 天 后 才能 得 到 结果 。 但 是 , 在 2012 年 时 , 在 Facebook 
内 部 的 实时 数据 分 析 系 统 ， 从 数据 落 到 服务 器 开始 ， 到 它 能 显示 在 工程 师 的 屏幕 上 ， 只 需 
要 1 分 钟 。 而 每 一 个 数据 查询 只 需要 1 秒 钟 就 会 返回 查询 结果 ”。 

如 何 对 待 上 面 所 说 的 这 类 “技术 债 ”， 必 须根 据 团队 和 产品 当前 的 具体 状态 分 析 。 就 
像 “ 房 贷 ” 一 样 ， 你 不 必 马 上 一 次 还 请 ， 但 仍旧 要 根据 自己 当前 的 财力 ， 以 及 对 未 来 的 收 
入 预期 ， 进 行 综合 判断 。 但 是 ， 它 们 必须 能 够 进入 企业 或 团队 的 业务 管理 视野 ， 促 使 他 们 
做 出 决策 。 这 不 只 是 技术 问题 ， 而 是 一 个 业务 问题 。 一 旦 决定 还 “ 债 "*， 那 么 它们 也 应 该 
被 纳入 迭代 需求 管理 之 中 ， 成 为 一 种 特殊 的 “用 户 故事 ”。 


6.3.3 ”参与 需求 拆 分 的 角色 


很 多 人 认为 ,传统 瀑 布 开 发 模式 中 ， 产 品 经 理 (或 者 业务 分 析 师 ) 是 撰写 需求 规格 说 
明 书 的 人 。 那 么 ,在 持续 交付 模式 下 ， 拆 分 用 户 故 事 的 工作 也 应 该 由 产品 经 理 自己 干 。 然 
而 ,这 是 一 个 严重 的 错误 认识 。 尽 管 产品 经 理 对 需求 列表 负 有 责任 ,但 是 ,假如 所 有 的 用 
户 故 事 都 是 产品 经 理 写 出 来 的 ， 那 么 这 可 能 就 是 用 户 故事 的 “ 坏 味道 ”。 

很 多 产品 经 理 对 技术 实现 方式 了 解 不 深 , 由 其 直接 拆 分 出 来 的 用 户 故 事 , 在 实现 工作 
量 方面 ,需求 之 间 的 差异 可 能 很 大 ,无 法 达到 我 们 所 希望 的 需求 持续 快速 流动 的 目的 。 在 
拆 分 用 户 故事 时 ,需要 对 拆 分 后 的 工作 量 有 个 基本 的 评判 。 如 果 做 不 到 这 一 点 ， 拆 分 后 的 
用 户 故 事 就 很 可 能 不 够 小 , 而 无 法 适应 在 迭代 周期 以 内 。 或 者 有 过 多 超 细 粒 度 的 用 户 故 事 ， 
导致 浪费 一 些 维护 管理 成 本 。 因 此 ， 需 求 拆 分 过 程 必须 卷 和 多 种 角色 。 

首先 , 让 开发 人 员 和 测试 人 员 参 与 需求 拆 分 的 第 一 个 好 处 是 他 们 能 够 更 多 地 掌握 产品 
需求 上 下 文 。 这 可 能 会 令 开发 团队 感觉 到 , 这 也 是 他 们 的 产品 , 会 产生 更 强 的 产品 拥有 感 ， 
比较 容易 缓解 和 消除 “你 对 决 我 们 ”这 样 的 对 立 情 绪 ， 也 能 够 更 多 地 增加 对 业务 需求 和 用 
户 故 事 的 了 解 。 
其 次 ,， 如 果 有 更 多 角色 参与 用 户 故 事 的 编写 , 就 能 更 多 地 了 解 产 品 需 求 和 用 户 故 事 的 
全 部 意图 ， 从 不 同 的 角色 思考 ,找到 更 多 更 好 的 方式 来 实现 这 些 需求 。 例 如 ,第 2 章 中 “ 立 
即 提现 ”案例 , 开发 人 员 提 出 了 最 经 济 快速 的 验证 方案 , 即便 只 实现 了 其 中 的 一 部 分 功能 ， 
也 已 经 足够 验证 产品 经 理 心中 的 假设 了 。 


















































@ 《Scuba: Diving into Data at Facebook》，Lior Abraham 等 
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6.3.4 不 平等 的 INVEST 原 则 


INVEST" 原 则 是 用 于 检验 用 户 故 事 是 否 拆 分 得 当 的 6 个 原则 , 它 由 下 面 6 个 英文 单词 的 
首 字母 组 成 。 

(1) independent (独立 ) : 用 户 故事 必须 彼此 独立 ， 低 耦合 。 

(2) negotiable (可 协商 ): 在 进入 开发 前 ,故事 卡 用 来 提醒 团队 和 干系 人 要 进行 讨论 ， 
而 不 是 直接 作为 产品 人 员 与 开发 人 员 之 间 的 契约 来 使 用 。 

(3) valuable (有 价值 ): 用 户 故事 对 用 户 或 客户 来 讲 必须 是 重要 的 ， 有 价值 的 。 

(4) estimable (可 估算 ): 开发 团队 必须 能 够 估算 创建 用 户 故 事 所 需 的 工作 量 。 

(5) small & similar size (规模 小 且 适 中 ) : 用 户 故 事 必 须 足 够 小 ， 尽 可 能 要 在 一 个 
迭代 内 完成 (建议 用 户 故 事 的 开发 工作 量 应 该 少 于 3 个 工作 日 )， 并 且 多 个 用 户 故 事 之 间 
的 开发 工作 量 差异 不 宜 过 大 。 你 对 足球 体积 的 估算 偏差 一 定 远 远 小 于 对 月 亮 体积 的 估算 
偏差 。 

(6) testable (可 验证 ): 用 户 故事 必须 是 可 以 被 验证 的 。 

在 现实 工作 中 ， 的 确 会 存在 一 小 部 分 非常 复杂 的 用 户 需求 入 很 难 同时 完全 满足 这 6 个 
原则 。 在 这 种 情况 下 ， 可 以 做 一 些 妥协 ,但 至 少 要 满足 可 估算 、 规 模 小 且 可 验证 ， 即 EST> 
INV。 假 如 无 法 独立 交付 ， 但 在 较 短 时 间 内 可 以 独立 开发 和 独立 验证 ， 且 不 影响 当前 已 完 
成 的 软件 功能 , 则 也 是 可 行 的 。 事实 上 , 这 种 分 解 后 的 小 需求 已 经 成 为 了 一 个 符合 SMART 
原则 的 任务 ， 即 具体 的 (specific)、 可 衡量 的 (measurable)、 可 达成 的 (achievable)、 相 
关 的 (relevant) 和 有 时间 限 定 的 time bound)。 


6.3.5 ”五 大 拆 分 技法 


为 了 帮助 大 家 掌握 更 好 的 用 户 故 事 拆 分 方法 ， 下 面 介绍 5 种 技法 。 只 要 多 加 练习 ， 就 
能 掌握 用 户 故 事 。 

1. 路 径 拆 分 法 

路 径 拆 分 法 是 指 根据 用 户 使 用 场景 中 的 不 同 路 径 进行 拆 分 。 例 如 ,用 户 在 电 商 网 站 购 
物 以 后 ， 需 要 支付 订单 ， 既 可 以 选择 微 信 支付 ， 也 可 以 选择 使 用 银行 卡 支付 。 对 于 这 样 
个 场景 ， 如 果 同 时 实现 两 种 支持 方式 的 工作 量 比较 大 ， 就 可 以 将 其 分 成 两 个 用 户 故 事 ， 如 
图 6-10 所 示 。 

(1) 用 户 可 以 使 用 微 信 支付 渠道 进行 付款 。 

(2) 用 户 可 以 使 用 银行 卡 渠道 进行 付款 。 












































Q@ 用 于 快速 评估 用 户 故 事 的 INVEST 清 单 来 自 Bil Wake 在 2003 年 写 的 一 篇 文章 “INVEST in Good Stories, and 
SMART Tasks”，2004 年 ，Mike Cohn 在 《用 户 故 事 与 敏 捷 方 法 》 一 书 中 推荐 了 它 。 
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用 微 信 支付 





tb 





银行 卡 支付 
图 6-10 路径 拆 分 示意 图 1 


假设 银行 卡 渠 道 因为 需要 支持 不 同 种 类 的 银行 卡 〈 借 记 卡 和 信用 卡 )， 或 者 同 种 类 但 
不 同 银行 的 卡 〈 如 招商 银行 和 工商 银行 )， 而 导致 工作 量 过 大 ， 那 么 还 可 以 进一步 将 其 按 
照 每 个 银行 每 种 类 型 的 支付 卡 来 拆 分 用 户 故 事 。 当 然 ， 如 果 你 在 实现 第 一 种 借 记 卡 〈 如 
招行 借 记 卡 ) 支付 时 ， 就 已 经 完成 了 较 多 的 基础 性 工作 ， 也 可 以 将 对 其 他 银行 的 借 记 卡 
支持 合并 写 在 同一 个 用 户 故 事 里 ， 如 图 6-11 所 示 ， 此 时 ， 需 求 可 写 为 :“ 支 持 除 招行 以 外 
的 其 他 两 个 银行 的 借 记 卡 通道 ”。 并 在 该 需求 上 注 明 : 依赖 于 用 户 故事 “实现 招行 借 记 卡 


通道 ”。 
信用 卡 支付 


招行 借 记 卡 
支付 


工行 借 记 卡 


支付 


建行 借 记 卡 
支付 


图 6-11 路径 拆 分 示意 图 2 























选择 购物 车 
中 的 物品 












2. 按 接触 点 拆 分 

所 谓 接触 点 就 是 指 用 户 与 系统 之 间 的 交互 通道 ,例如 移动 端 应 用 和 PC 浏览 器 是 两 种 不 
同 的 接触 点 。 而 在 PC 浏览 器 上 ， 又 可 以 按 不 同 的 浏览 器 来 分 ， 如 Safari、Chrome、Firefox 
和 IE。IE 浏 览 器 的 适 配 工 作 量 比 较 大 ， 而 其 他 几 种 浏览 器 的 适 配 工 作 量 比 较 小 ， 那 么 我 们 
就 可 以 分 成 两 个 用 户 故事 ， 它 们 分 别 是 : 

(1) 用 户 可 以 使 用 下 内 核 的 浏览 器 查看 ; 

(2) 用 户 可 以 使 用 非 耻 内 核 的 浏览 器 查看 。 
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3. 按 数据 类 型 或 格式 拆 分 

如 果 有 一 个 软件 ， 它 是 做 数据 统计 与 分 析 的 工具 。 其 中 有 这 样 一 个 需求 ， 用 户 可 以 通 
过 文件 形式 向 软件 系统 导入 数据 ， 文 件 格式 包括 CSV、XML 和 Excel。 那 么 ， 我们 的 用 户 
故事 可 以 直接 分 成 3 个 。 

(1) 用 户 可 以 通过 CSV 格 式 的 文件 上 传 数据 。 

(2) 用 户 可 以 通过 XML 格式 的 文件 上 传 数据 。 

(3) 用 户 可 以 通过 Excel 格 式 的 文件 上 传 数 据 。 

4. 按 规则 拆 分 

规则 是 指 业务 规则 或 者 技术 规则 。 假 如 有 一 个 海上 航运 配 货 规划 系统 ,其 中 有 一 个 需 
求 是 : 输入 起 点 和 终点 ， 可 以 根据 货物 的 种 类 选择 最 佳 的 配送 线路 。 那 么 这 个 需求 可 以 分 
成 两 部 分 : 一 是 货物 的 种 类 ， 二 是 航线 。 当 分 解 这 个 需求 时 ， 如 按 航 线 来 分 ， 可 以 分 成 两 
个 : 一 个 是 基础 需求 ， 一 个 是 完善 需求 。 

。 基础 需求 是 : 用 户 选 择 起 点 和 终点 ， 系 统 可 以 选 出 一 条 配送 航线 。 

。 完善 需求 是 : 用 户 选 择 起 点 和 终点 ， 系 统 可 以 选择 一 条 时 间 最 短 的 配送 航线 。 

这 两 个 需求 之 间 会 有 一 定 的 递 进 依存 关系 ,但 它们 可 以 分 别 实现 。 其 中 ,“ 时 间 最 短 ” 
就 是 一 个 规则 。 如 果 用 户 需 要 新 的 “最 佳 航线 ”计算 方式 , 则 可 以 再 添加 新 的 规则 。 

5. 按 探索 路 径 拆 分 

在 开发 过 程 中 ， 团 队 总 是 遇 到 一 些 对 团队 来 说 都 很 陌生 的 事物 或 不 确定 的 实现 方案 ， 
例如 ， 必 须 使 用 某 种 新 的 框架 或 技术 ， 而 且 也 找 不 到 外 援 专家 来 帮助 团队 。 此 时 可 以 将 对 
陌生 事物 的 试验 性 探索 逐步 分 拆 成 不 同 的 探索 故事 。 这 种 探索 故事 有 较 大 的 不 确定 性 ， 因 
此 要 作为 高 风险 点 管理 ， 时 刻 关 注 其 进展 。 


6.3.6 七 大 组 成 部 分 
目前 行业 中 ， 通 常 以 “用 户 故事 ”来 称呼 交付 迭代 中 的 需求 。 用 户 故 事 (User Story) 
最 早 来 自 极 限 编 程 的 十 二 最 佳 实践 ， 它 为 了 提醒 撰写 者 时 刻 从 用 户 角度 出 发 , 设 定 了 如 下 
形式 的 一 句 话 : 
作为 a 一 个 XXXX 用 户 oe 
为 了 完成 Bd YYYYY 业 务 So 
我 希望 能 够 …… 使 用 ZZZZZ 功 能 …… 
当然 , 这 只 是 用 户 故 事 刚 刚 诞 生 时 的 初始 形式 , 我 们 需要 对 其 进行 不 断 地 探索 和 完善 ， 
直到 其 足以 胜任 我 们 赋予 它 的 使 命 ， 即 成 为 各 角色 在 氨 代 过 程 中 的 协作 和 达成 共识 的 桥 
梁 ， 直 至 实现 其 所 描述 的 功能 需求 ， 并 且 达 到 其 所 要 求 的 验收 条 件 为 止 。 因 此 ， 每 个 用 户 
故事 通常 会 包含 以 下 7 个 组 成 部 分 。 
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编号 : 方便 记录 与 跟踪 。 


(1) 

(2) 名 称 : 该 功能 及 其 目标 概要 。 

(3) 描述 : 简单 介绍 这 个 功能 的 上 下 文 和 业务 目的 与 要 求 。 

(4) 技术 备 忘 : 简单 记录 每 次 讨论 过 程 中 的 一 些 重要 技术 点 ， 可 能 会 包括 一 些 设计 
信息 


(5) 前 提 假 设 : 在 对 该 用 户 故 事 进行 估算 或 启动 实现 时 ， 应 该 满足 哪些 前 提 假 设 。 
(6) 依赖 关系 : 该 用 户 故 事 依赖 哪些 内 外 需求 。 
(7) 验收 条 件 : 该 用 户 故 事 达 到 交付 标准 的 定义 与 描述 。 


6.4 ”需求 分 析 与 管理 工具 集 


当 我 们 把 需求 拆 分 以 后 ， 你 会 发 现 ,我 们 面 对 的 是 一 堆 卡 片 ， 尤其 是 当 我 们 面 对 的 是 
一 个 大 型 复杂 项 目 时 。 因 此 ， 我 们 需要 更 好 的 方式 把 它们 有 效 地 组 织 和 管理 起 来 。 有 哪些 
工具 来 组 织 它 们 呢 ? 

我 们 在 第 2 章 中 已 经 介绍 过 的 “量化 式 影响 地 图 ”和 “用 户 旅程 地 图 *"， 都 是 可 以 用 来 
进行 需求 分 析 和 管理 的 工具 。 下 面 ， 我 们 再 介绍 几 种 常用 的 需求 分 析 与 管理 工具 。 


6.4.1 用 户 故 事 地 图 


用 户 故 事 地 图 的 概念 来 自 Jeff Patton 的 著作 《用 户 故 事 地 图 》, 既是 一 种 团队 沟通 工具 ， 
也 是 一 种 需求 分 析 管 理工 具 。 常 被 用 于 产品 版 本 周期 中 的 准备 期 。 它 用 结构 化 的 二 维 视图 
统一 团队 成 员 思维 模式 ， 从 用 户主 流程 和 业务 紧急 度 两 个 维度 共同 分 析 ， 并 可 以 定期 地 将 
该 地 图 取出 ， 重 新 审视 与 修订 。 

在 每 张 用 户 地 图 上 ， 横 轴 是 该 地 图 拥有 者 的 活动 主 路 径 ， 在 横 轴 之 上 是 他 (她 ) 的 主 
要 活动 描述 ， 可 以 称 为 史诗 故事 (或 者 功能 集 )。 它 们 按照 活动 发 生 的 顺序 从 左 到 右 排 开 。 
在 横 轴 之 下 ,每 个 史诗 故事 的 下 方 是 该 史诗 故事 拆 分 出 来 的 更 细 粒 度 的 用 户 故 事 。 纵 轴 表 
示 根 据 显示 目标 制订 的 业务 优先 级 ， 即 非常 重要 或 者 必 不 可 少 的 用 户 故 事 可 以 放 在 上 面 ， 
次 之 的 放 在 下 面 ， 更 低 优先 级 的 用 户 故 事 可 以 放 在 最 下 面 。 这 样 ， 用 户 故 事 就 会 根据 目标 
和 优先 级 ， 被 分 成 多 个 批 次 ， 后 续 可 以 进行 分 批 交 付 。 假 如 该 产品 有 多 种 不 同类 型 的 用 户 
(如 商家 和 顾客 )， 那 么 每 个 用 户 类 型 都 可 能 有 对 应 它 的 故事 地 图 。 

下 面 是 以 图 书 销售 网 站 为 例 , 给 出 针对 购书 顾客 的 用 户 故 事 地 图 示例 , 如 图 6-12 所 示 。 
我 们 可 以 将 所 有 用 户 故事 分 成 3 批 ， 目 标 一 “用 户 能 够 购买 图 书 ” 对 应 的 这 组 需求 就 可 以 
作为 一 个 最 小 可 行 解 决 方案 ， 进 行 首 批 交付 。 当 然 ， 在 现实 业务 需求 中 ， 哪 些 是 高 优先 级 
用 户 故 事 ， 需 要 根据 企业 实际 的 产品 目标 、 市 场 策略 等 来 确定 。 
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rs ] Ca] Da] [二 ] [| 
目标 一 : 用 户 能 够 购买 图 书 


目标 二 : 更 多 的 购买 便捷 性 


目标 三 : 用 户 互动 性 评 星 

















图 6-12 ”用 户 故 事 地 图 














6.4.2 用 户 故 事 树 
为 了 看 产品 特性 的 全 貌 ， 也 可 以 使 用 树 状 方式 进行 用 尸 故 事 的 管理 ， 即 按照 “产品 一 特 
性 集 一 用 户 故事 ”或 者 “产品 一 用 户 一 特性 集 一 用 户 故事 ”等 多 种 级 别 来 组 织 ， 并 且 标 记 完 
成 情况 , 使 所 有 人 了 解 产 品 的 进展 , 如 图 6-13 所 示 , 带 有 “vy” 号 的 卡片 为 “已 完成 的 需求 ”。 
产品 用 户 特性 集 用 户 故事 








和 


下 | 库存 管理 | 


图 6-13 用户 故事 树 
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6.4.3 ”依赖 关系 图 


用 户 故 事 地 图 是 从 业务 角度 来 讨论 和 确认 用 户 故 事 , 而 依赖 关系 图 是 从 依赖 角度 来 建 
立 用 户 故事 之 间 的 关联 关系 。 虽然 我 们 希望 所 有 的 用 户 故 事 之 间 都 是 相互 独立 的 , 但 在 现 
实 中 并 不 容易 。 我 们 还 是 会 发 现 ， 一 些 用 户 故 事 间 会 有 依赖 关系 。 这 种 依赖 关系 可 能 是 功 
能 增强 型 ， 如 在 货运 航线 规划 系统 中 , “找到 成 本 最 佳 航 线 ” 通 常会 在 “找到 基本 航线 ” 
之 后 实现 ， 如 图 6-14 所 示 。 这 些 依赖 的 前 后 关系 也 会 影响 工作 量 的 估算 。 





















根据 历史 记录 判 


断 最 佳 航线 
Pe 根据 天 气 预报 ， 
找到 基本 找到 成 本 最 佳 货 结合 历史 记录 ， 
货运 航线 运 航 线 找到 最 佳 航线 


找到 时 间 最 短 货 
运 航线 


图 6-14 ”货运 航线 用 户 故 事 依赖 图 





















> 杂项 目 通常 会 由 多 个 团队 共同 完成 。 不 同 团队 开发 的 用 户 故事 之 间 也 会 存在 依 
赖 关 系 。 这 些 依赖 关系 都 会 对 产品 迭代 交付 的 周期 与 计划 产生 影响 。 通 过 依赖 关系 图 可 以 
ed 


6.4.4 ”需求 管理 数字 化 平台 


当 需 求 被 拆 分 成 很 多 用 户 故 事 以 后 , 为 了 提高 团队 各 角色 之 间 的 协作 效率 ， 并 能 够 更 
好 地 保存 与 组 织 众 多 用 户 故 事 及 需求 内 容 ， 其 至 做 到 需求 与 源 代码 之 间 的 自动 关联 ， 我 们 
应 该 使 用 数字 化 需求 管理 系统 对 其 进行 管理 。 这 类 需求 管理 系统 应 该 尽 可 能 支持 上 述 各 种 
需求 分 析 、 管 理 和 展示 工具 。 

其 是 在 分 布 式 团 队 的 环境 中 ， 数 字 化 需求 管理 平台 是 提高 团队 协作 效率 的 必 有 备 
工具 。 


6.5 团队 协作 管理 工具 


无 论处 于 产品 版 本 周期 中 的 哪个 时 期 , 我 们 通常 都 会 应 用 一 些 方法 或 工具 ,以便 让 多 
种 角色 提升 协作 效率 。 我 们 的 目标 不 但 要 聚焦 于 个 人 工作 效率 提升 ， 更 要 关注 整个 团队 的 
工作 效率 提升 。 这 些 协作 管理 工具 最 重要 的 特征 就 是 信息 透明 和 可 视 化 。 下 面 是 我 曾 使 用 
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过 的 一 些 通用 方法 与 工具 。 
6.5.1 团队 共享 日 历 


当 多 人 共同 完成 一 项 任务 时 ， 如 何 高 效 协 调 团 队 中 每 个 人 的 时 间 , 是 一 个 非常 大 的 挑 
战 。 共享 日 历 是 一 种 有 效 的 团队 时 间 管 理 方法 。 共享 日 历 可 以 分 为 两 种 : 一 是 团队 时 间 表 ， 
二 是 个 人 非 工 作 时 间 表 。 
团队 时 间 表 是 指 对 多 角色 参与 的 常规 活动 提前 进行 时 间 安 排 , 它 可 以 让 所 有 角色 都 根 
据 这 一 固定 时 间 表 来 规划 个 人 的 工作 时 间 与 市 奏 , 减少 不 必要 的 协调 成 本 ,团队 时 间 表 中 
规定 了 在 一 个 迭代 周期 中 的 各 种 例 行 协作 时 间 点 和 内 容 。 这 个 时 间 表 的 制订 需要 多 角色 共 
同 商定 ， 尽 可 能 满足 每 个 角色 的 时 间 需 求 ， 避 免 因 经 常 发 生 事件 冲突 而 导致 时 间 表 失效 的 
问题 。 
图 6-15 就 是 某 团 队 交 付 期 的 团队 迭代 时 间 表 ， 该 团队 以 每 两 周 为 一 个 迭代 周期 ， 甚 中 
的 每 一 个 事件 都 明确 定义 了 参与 人 、 目 标 以 及 时 间 要 求 等 。 



































下 一 选民 
需求 测试 用 例 
邮件 评审 











1lh 选 代 总 结 回顾 会 


下 一 达 代 
需求 用 例 确 认 





0.5h 下 一 达 代 
需求 确认 








图 6-15 ”团队 时 间 表 


个 人 非 工作 时 间 表 是 指 一 个 团队 的 工作 日 历 。 团队 中 的 每 个 人 都 将 其 可 预期 的 非 工 作 
时 间 提 前 标记 下 来 ， 如 自己 已 计划 的 年 假 ， 或 者 可 预期 的 事假 ， 如 图 6-16 所 示 。 这 个 时 间 
表 发 挥 作用 的 一 个 重要 前 提 是 “及 时 更 新 ”。 
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May 2018 < Today 》 
Mon Tue Wed Thu Fri 
1May 2 3 【4) 
五 一 假期 Bob 和 Sara 休 年 假 〈 三 天 ) 
7 8 9 10 11 
14 15 16 17 18 
David 休 年 假 
21 22 23 24 25 
28 29 30 31 
Sara 休 假 半 天 


图 6-16 个 人 非 工 作 时 间 表 
6.5.2 团队 回顾 


除 针 对 “ 事 ” 的 各 种 协作 流程 与 会 议 之 外 , 我 们 还 要 介绍 一 种 面向 “人 ”的 管理 工具 ， 
即 团队 回顾 (Retrospecitve)。 团 队 回 顾 是 指 所 有 团队 成 员 在 一 起 共同 对 过 去 一 段 时 间 中 的 
团队 协作 状态 进行 总 结 ， 以 便 继续 保持 那些 良好 的 协作 习惯 ,同时 持续 发 现 协 作 中 存在 的 
可 提升 空间 ， 共 同 探索 改进 方案 。 

团队 回顾 会 议 的 参与 者 应 该 包括 在 过 去 一 段 时 间 中 参与 产品 准备 或 交付 活动 的 所 有 
成 员 。 这 种 针对 改善 团队 协作 方面 的 会 议 也 应 该 周期 性 举行 ,并且 避免 经 常 有 人 缺席 的 现 
象 。 这 是 “持续 交付 2.0” 的 “持续 改善 ”工作 原则 的 体现 。 由 于 团队 所 有 人 都 需要 参加 这 
个 会 议 ， 因 此 最 好 能 够 邀请 非 本 团队 成 员 帮 助 主持 会 议 。 如 果 条 件 不 允许 ， 则 可 以 团队 成 
员 轮 流 主持 ， 每 次 选择 一 名 成 员 。 

在 团队 还 没有 理解 和 掌握 回顾 会 议 的 精髓 时 ， 对 主持 人 的 主持 技能 要 求 较 高 。 在 会 议 
开始 前 ， 主 持 人 应 该 让 参与 者 感到 “安全 ”"， 并 在 会 议 过 程 维 持 这 种 “安全 感 "。 由 于 在 讨 
论 过 程 中 ， 总 会 讨论 到 一 些 协 作 不 顺畅 的 问题 ， 因 此 此 时 要 求 意见 表达 者 使 用 正确 的 表达 
方式 ,例如 “我 看 到 了 …… 我 的 感受 是 …… 我 想 …… 这 么 做 是 不 是 会 更 好 …… 你 觉得 呢 ?“ 
一 且 发 现 表 达 者 或 信息 接收 者 过 于 情绪 化 ， 主 持 人 应 该 及 时 提醒 ， 并 设法 解决 情绪 上 的 
矛盾 。 

回顾 会 议 的 产 出 是 一 个 团队 达成 共识 的 可 执行 的 改善 行动 列表 , 并 且 每 一 个 行动 项 都 
要 指定 一 个 跟踪 者 ， 负 责 跟踪 该 行动 的 执行 情况 ， 并 在 下 次 回顾 会 议 时 呈报 执行 结果 。 需 
要 注意 的 是 ， 这 个 改善 行动 列表 不 宜 过 长 ， 每 次 都 应 该 聚焦 于 少量 最 重要 的 改进 项 ， 以 确 
保 能 够 切实 执行 。 否 则 ， 很 容易 使 回顾 会 议 流 于 形式 ， 对 日 常 工 作 疫 有 任何 影响 。 
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在 第 4 章 中 我 们 讨论 过 ， 回 顾 会 议 的 氛围 直接 反映 了 组 织 文化 。 然 而 ， 它 也 是 构建 组 
织 文 化 的 重要 手段。 因此 ， 每 一 位 管理 者 都 应 该 重视 这 一 针对 团队 协作 的 改进 活动 。 我 们 
甚至 可 以 认为 ， 回 顾 会 议 的 质量 是 团队 协作 质量 的 指示 器 。 
6.5.3 ”可视化 故事 墙 

目前 很 多 团队 都 采用 卡片 墙 方式 对 需求 进行 管理 ,即将 用 户 需求 写 到 卡片 上 , 并 根据 
其 当前 的 状态 或 者 所 处 的 阶段 ， 放 置 于 对 应 的 位 置 。 常 见 的 有 两 种 基本 形式 :(1) 根据 任 
务 状态 (to do/doing/done) 进行 简单 分 类 ， 如 图 6-17a 所 示 ; (2) 根据 迭代 需求 的 研发 状态 
( 待 开发 /开发 中 / 待 测试 /测试 中 /测试 完成 / 待 上 线 ) 进行 分 类 管理 ， 如 图 6-17b 所 示 。 





























Todo Doing Done 待 开发 开发 中 待 测试 | 测试 中 | 测试 完成 














图 6-17 团队 工作 可 视 化 
精益 思想 强调 价值 的 流动 ， 消 除 各 环节 中 的 等 待 。 图 6- 芒 中 的 两 类 任务 墙 都 没有 体现 

















出 完整 的 价值 流 ， 图 6-17a 展 现 的 是 每 个 任务 的 完成 情况 ， 没 有 体现 出 价值 流 ， 图 6-17b 体 
现 了 局 部 价值 流 ， 因 此 很 容易 让 团队 只 关注 当前 迭代 的 内 容 ,“ 只 见 树 木 ， 不 见 森 林 "。 事 
实 上 ， 软 件 开发 活动 中 的 价值 流 如 图 6-18 所 示 ， 包 含 从 需求 产生 到 功能 上 线 的 全 过 程 。 








需求 池 初稿 评审 稿 | 用 例 分 析 | 待 开发 开发 中 待 测试 测试 中 待 上 线 已 上 线 


ME ER ME | 
因 DD i DD 














图 6-18 ”全 流程 故事 墙 


只 有 将 所 有 人 的 工作 可 视 化 出 来 , 才能 更 容易 识别 团队 协作 流程 中 的 问题 并 加 以 解 
决 。 这 种 可 视 化 任务 墙 的 使 用 不 仅 可 以 用 于 软件 产品 开发 过 程 , 还 可 以 用 于 日 常 运 维 工作 。 





6.5.4 明确 “完成 ”的 定义 

多 人 协作 过 程 最 容易 出 现 的 就 是 理解 不 一 致 。 因 此 ,团队 应 该 尽 可 能 对 每 类 任务 都 定 
义 “ 完 成 ”(Done) 的 标准 ， 这 也 是 验证 环 质量 内 建 原则 的 一 种 体现 。 例 如 ,团队 成 员 需 
要 完成 哪些 和 活动， 交付 物 要 达到 怎样 的 标准 ， 才 能 将 墙 上 的 卡片 从 一 个 状态 栏 移 动 到 另 一 
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个 状态 栏 。 通 过 对 “完成 标准 ”的 定义 ， 我 们 可 以 强化 团队 成 员 的 质量 意识 ， 规 范 团 队 质 
量 行 为 ， 以 减少 不 必要 的 返工 。 这 些 “完成 ”的 定义 不 但 应 该 让 大 家 都 知道 ， 而 且 应 该 显 
式 张贴 出 来 ， 以 便 在 工作 中 时 刻 受 到 提醒 。 

在 第 15 章 的 实战 案例 中 ， 团 队 就 是 将 “可 视 化 任务 墙 ” 与 “明确 定义 “完成 标准 一 
这 两 种 工具 相 结 合 ， 以 精益 思想 为 指导 ， 形 成 非常 强大 的 改进 推动 力 ， 对 团队 协作 流程 进 
行 多 次 改造 ， 从 而 提高 了 协作 效率 。 


6.5.5 ”持续 集成 

将 需求 分 解 成 更 细 粒 度 以 后 , 团队 多 人 可 以 并 行 开展 工作 , 同时 也 应 该 将 工作 成 果 持 
续集 成 在 一 起 ， 并 确保 达到 质量 标准 。 更 多 有 关 持续 集成 的 信息 ， 详 见 第 9 章 。 
6.5.6 ”故事 验证 


在 迭代 过 程 中 ,团队 各 角色 是 围绕 用 户 故 事 展 开 协 作 的 。 当 开发 人 员 准 备 开发 前 ， 应 
该 与 产品 人 员 和 测试 人 员 共 同 对 该 用 户 故 事 的 7 项 内 容 进 行 快速 审查 ， 并 达成 共识 。 开 发 
人 员 开 发 完成 后 ， 应 该 进行 自 测 ， 再 让 产品 人 员 在 自己 的 开发 调试 环境 上 做 快速 验收 (也 
被 称 为 mini-showcase， 迷 你 演示 )。 若 产品 人 员 没 有 发 现 明 显 问 题 或 严重 问题 ， 再 转交 给 
测试 人 员 对 这 个 用 户 故 事 马 上 进行 全 面 验收 ， 如 图 6-19 所 示 。 


GO GO GO GO GO 
共识 开发 自 测 迷你 验收 故事 验证 
图 6-19 ”用 户 故 事 验 证 流程 


















































6.6 小结 


本 章 具体 阐述 了 产品 版 本 周期 准备 期 、 交 付 期 的 重点 内 容 , 以 及 需求 拆 分 带 来 的 收益 
与 随 之 而 来 的 固定 成 本 。 如 果 无 法 降低 这 些 固定 成 本 ,那么 很 难 收获 更 大 的 价值 。 为 了 能 
够 真正 获得 拆 分 带 来 的 收益 ， 在 做 需求 拆 分 时 就 要 尽 可 能 遵守 INVEST 原 则 (INV< EST)。 
为 了 帮助 读者 更 好 地 掌握 拆 分 技术 ， 本 章 还 总 结 了 五 大 拆 分 技法 ， 以 及 每 个 用 户 故 事 应 该 
包含 的 7 个 组 成 部 分 。 

需求 分 析 与 管理 的 方法 与 工具 有 很 多 ,本 章 介绍 的 用 户 故 事 地 图 、 用 户 故 事 树 和 依赖 
关系 图 是 较为 常见 的 需求 梳理 工具 。 

另外 ,本章 还 介绍 了 和 迭代 过 程 中 提高 团队 协作 的 工具 与 方法 ， 包 括 共享 时 间 表 、 回 顾 
会 议 、 持 续集 成 和 故事 验证 。 
































和 
部 署 流水 线 原则 与 工具 设计 





立 凡 署 流 水 线 (deployment pipeline) 是 持续 交付 1.0 的 核心 模式 。 它 是 对 软件 交付 过 

人 
个 过 程 , 为 团队 提供 状态 可 视 化 和 即时 反馈 。 部 署 流水 线 的 设计 受到 软件 架构 、 分 支 策略 、 
团队 结构 以 及 产品 形态 的 影响 ， 因 此 每 个 产品 的 部 署 流 水 线 均 有 所 不 同 。 

本 章 将 重点 介绍 产品 团队 设计 和 使 用 部 署 流水 线 的 基本 原则 , 以 及 企业 开发 部 署 流水 
线 平台 工具 链 时 ， 需 要 构建 的 平台 能 力 要 求 ， 以 及 相关 子 系统 的 服务 逻辑 架构 。 

让 我 们 先 从 一 个 简单 的 部 署 流水 线 案例 开始 吧 ! 


7.1 简单 的 部 署 流水 线 


我 们 以 2008 年 商业 套装 软件 产品 Cruise 为 例 ， 来 解释 持续 交付 部 署 流 水 线 的 概念 。 该 
品 思想 最 早 来 源 于 开源 软件 CruiseControl 的 企业 版 本 。Cruise 自 2008 年 第 一 个 版 本 发 布 以 
后 ， 每 3 个 月 发 布 一 个 商业 化 版 本 ， 供 全 球 企业 用 户 试用 和 购买 。 截 至 2010 年 ， 代 码 行 数 
约 为 50000 行 ， 自 动 化 单元 测试 和 集成 测试 用 例 约 为 2350 个 ， 端 到 端 功能 测试 用 例 约 为 140 
个 。 后 来 更 名 为 GoCD ， 并 将 社区 版 开源 后 ， 放 到 了 GitHub 网 站 上 。 以 下 均 以 “GoCD” 之 
名 进行 描述 。 
7.1.1 简单 的 产品 研发 流程 


GoCD 系 统 是 典型 的 服务 器 /代理 (server/agent) 架构 ， 服 务 器 和 客户 端 各 自 可 独立 启 
动 运行 。 服 务 器 本 身 曾 是 一 个 典型 的 巨石 应 用 ， 包 含 关 系 型 数据 库 和 Java 应 用 服务 器 。 用 
户 可 以 通过 浏览 器 访问 其 Web 服务， 同时 它 也 提供 REST 风 格 的 API 接 口 ， 方 便 用 户 进行 程 
序 扩 展 ， 架 构 示意 图 如 图 7-1 所 示 。 

服务 器 和 代理 的 代码 (包括 自动 化 测试 代码 ) 全 部 保存 于 同一 个 代码 仓库 ， 版 本 控制 
软件 使 用 的 是 Mercural (与 Git 类 似 的 分 布 式 版 本 管理 工具 )， 团 队 成 员 均 有 权 修 改 代码 库 
中 的 任何 代码 。 产 品 研发 团队 的 总 人 数 保 持 在 12 人 左右 。 在 产品 版 本 交付 期 中 ， 友 代 周 期 
为 一 周 。 团 队 自 身 也 使 用 该 产品 进行 持续 集成 与 持续 交付 实践 。 在 每 个 迭代 结束 后 ， 用 最 
新 版 本 替换 团队 自己 正在 使 用 的 旧版 本 。 每 两 个 欠 代 将 试用 版 本 部 署 到 公司 内 部 的 公用 服 
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务 器 上 ， 供 公司 其 他 团队 使 用 。 者 公司 内 部 试用 版 本 运行 质量 达标 ， 一 周 后 再 将 该 版 本 交 
付 给 该 产品 的 试用 企业 ， 进 行 外 部 企业 用 户 早期 体验 ， 如 图 7-2 所 示 。 





服务 器 代理 

















= 单 周 blood 版 本 (团队 ) 
目 = 双 周 Alpha 版 本 (公司 ) 
〇 = 双 周 Beta 版 本 (外 部 ) 
和 = 全 球 发 布 
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准备 期 交付 期 准备 期 
图 7-2 GoCD 2008 年 到 2010 年 的 持续 交付 流程 
由 于 团队 使 用 测试 驱动 开发 方法 , 因此 开发 人 员 编 写 所 有 的 自动 化 单元 测试 用 例 与 功 
能 自动 化 测试 用 例 ， 并 负责 维护 它们 。 单 元 测试 的 行 覆 盖 率 在 75% 一 80% 波 动 。 


7.1.2 初始 部 署 流水 线 


GoCD 团 队 遵 守 持 续集 成 六 步 提交 法 (参见 第 9 章 )， 任 何人 提交 代码 后 ， 立 即 自动 触 
发 一 次 部 署 流水 线 实例 化 ， 该 部 署 流水 线 如 图 7-3 所 示 。 

第 一 个 阶段 是 “提交 构建 "， 包 括 7 个 并 行 自 动 化 任务 ， 分 别 是 编译 打包 、 代 码 规范 静 
态 扫 描 和 5 个 不 同 的 自动 化 单元 /集成 测试 用 例 集合 ， 使 用 自动 触发 机 制 。 产 品 的 自动 化 集 
成 测试 也 使 用 单元 测试 框架 编写 ， 并 在 提交 构建 阶段 与 单元 测试 一 起 执行 。 由 于 GoCD 支 
持 多 种 操作 系统 ， 因 此 在 这 一 阶段 会 同时 构建 生成 对 应 不 同 操作 系统 的 软件 包 ， 如 .deb 文 
件 、.exe 文 件 、.zip 文 件 等 。 这 些 安装 文件 生成 以 后 ， 可 供 后 续 所 有 阶段 使 用 。 后 续 所 有 阶 
段 不 再 重新 编译 打包 。 

第 二 个 阶段 是 “次 级 构建 "， 包 括 两 个 并 行 自 动 化 功能 测试 集 任务 ， 分 别 运行 于 两 类 
环境 ， 即 Windows 系 统 /下 浏览 器 和 Linux 系 统 /Firefox 训 览 器 ， 并 且 两 个 环境 中 所 用 的 测试 
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注 





用 例 集 相同 。 使 用 自动 触发 机 制 。 


bs hs hs hs hs hs 
一 1 提交 构建 >2, 次 级 构建 > 3.UAT 部 署 >4. UAT 结 果 》5. 性 能 测试 >6. 内 部 体验 >7. 外 部 体验 >8, 上 传 发 布 


编译 打包 | | 洋 到 测试 | |UAr 署 | | 标记 版 本 | | 性 测试 | | 上 人 上 本 | 上传 上 本 | | 上 人 上 本 
本 Linux/Firefox 
代码 扫描 | | 端 到 端 测试 

















图 7-3 GoCD 在 2008 年 的 部 署 流水 线 

第 三 个 阶段 开始 ， 每 个 阶段 都 只 有 一 个 任务 。 

第 三 个 阶段 是 “UAT 部 署 "， 将 软件 包 部 署 到 手 玉 UAT 环 境 (用 户 验 收 环境 ，User 
Acceptance Environment) 。 

第 四 个 阶段 是 “UAT 结 果 ”， 测 试 人 员 手 工 验证 完成 后 将 其 标记 为 “验收 通过 ”。 

第 五 个 阶段 是 “性 能 测试 "， 就 是 做 自动 化 性 能 测试 。 

第 六 个 阶段 是 “内 部 体验 ”， 就 是 将 Alpha 版 本 部 署 到 企业 内 部 服务 器 ， 给 内 部 其 他 团 
队 试用 。 

第 七 个 阶段 是 “外 部 体验 ”， 就 是 将 Beta 版 本 发 给 外 部 的 企业 用 户 体验 。 

第 八 个 阶段 是 “上 传 发 布 ”， 就 是 上 传 版 本 。 将 确定 的 商业 发 布 版 本 上 传 到 指定 服务 
器 ， 供 用 户 登 录 产 品 网 站 自行 下 载 。 

每 次 提交 代码 后 ， 部 署 流 水 线 的 提交 构建 都 会 被 自动 触发 。 提 交 构 建成 功 后 会 自动 触 
发 次 级 构建 。 提 交 构 建 阶段 的 7 个 任务 中 ， 执 行 时 间 最 长 的 是 单元 测试 ， 其 中 JavaScript 和 
Java 单 元 测试 用 例 与 集成 测试 用 例 共有 2350 多 个 , 被 分 成 5 个 测试 集 , 最 长 的 一 个 测试 集 持 
续 时 间 约 为 15 分 钟 。 次 级 构建 的 两 个 并 行 任务 ， 端 到 端 功 能 验收 测试 140 多 个 ， 执 行 时 间 
最 长 需要 约 30 分 钟 。 

第 三 个 阶段 (UAT 部 署 ) 由 测试 工程 师 手工 触发 。 测试 工程 师 根据 具体 需求 完成 情况 ， 
在 已 经 通过 次 级 构建 阶段 的 那些 构建 中 ， 选 择 一 个 被 测 版 本 ， 向 UAT 环 境 部 署 软 件 包 ， 用 
于 手工 验收 测试 。 如 果 该 版 本 通过 了 手工 验收 测试 ， 则 测试 人 员 会 手工 触发 第 四 个 阶段 ， 
系统 自动 标记 该 版 本 为 已 测试 通过 版 本 。 
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第 五 个 阶段 的 性 能 测试 也 是 手工 触发 。 
7.1.3 流水 线 执行 状态 解析 


开发 人 员 每 次 提交 代码 都 会 触发 一 次 部 署 流水 线 。 测试 人 员 只 从 通过 次 级 构建 的 那些 
版 本 中 选择 包含 新 功能 的 版 本 进行 UAT 部 署 ， 并 进行 手工 测试 。 验 收 结束 后 ， 触 发 “UAT 
结果 ”。 团 队 会 定期 触发 性 能 测试 。 这 个 部 署 流 水 线 的 运行 实例 示意 图 如 图 7-4 所 示 。 




















纲 息 | 虐 提交 构建 。 >》2 次 级 构建 > 3. UAT 部 署 >4 UAT 结 果 > 5 性 能 测试 >6 内 部 发 布 >7. 外 部 体验 > 8. 上 传 发 布 > 
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本 
3 [CV ] 六 -< 一 该 版 本 的 提交 构建 结束 时 ， 前 一 次 级 构建 正在 运行 ， 所 以 跳 过 一 次 
2 记 Yk 一 还 没有 新 功能 开发 完成 ， 不 会 进行 UAT 部 署 


图 7-4 ”GoCD 的 部 署 流水 线 运 行 实例 


团队 开发 工程 师 每 人 每 天 都 会 提交 一 次 。 因 此 ， 这 个 部 署 流水 线 每 天 都 会 启动 多 次 。 
当然 并 不 是 每 次 提交 的 变更 都 会 走 到 最 后 的 “上 传 发 布 "。 也 不 是 每 次 提交 都 会 走 到 UAT 
部 署 , 因为 开发 人 员 并 不 是 完成 一 个 功能 需求 后 才 提交 代码 , 而 是 只 要 做 完 一 个 开发 任务 ， 
就 可 以 提交 。 每 个 功能 可 能 由 多 个 开发 任务 组 成 ， 开 发 工程 师 需要 确保 即便 提交 了 功能 尚 
未 开发 完成 的 代码 ， 也 不 会 影响 已 开发 完成 的 那些 功能 。 
7.2 部 署 流水 线 的 设计 与 使 用 

上 面 介绍 的 GoCD 团 队 的 部 署 流 水 线 虽 然 是 一 个 简单 的 部 署 流水 线 ， 但 其 设计 及 运作 
方式 体现 了 团队 使 用 部 署 流水 线 的 设计 原则 与 协作 纪律 。 
7.2.1 流水 线 的 设计 原则 

流水 线 的 设计 遵循 以 下 原则 。 

1. 一 次 构建 ， 多 次 使 用 

当 某 个 部 署 流水 线 的 一 次 运行 实例 构建 出 制品 〈 如 二 进 制 软件 包 ) ， 如 果 需 要 ， 它 就 
应 该 直接 被 用 于 该 流水 线 后 续 阶 段 的 构建 过 程 ， 而 不 是 在 后 续 阶段 中 被 再 次 重复 构建 。 如 
果 该 部 署 流 水 线 实例 触发 了 下 游 流 水 线 ， 并且 下 游 流 水 线 也 使 用 该 制品 ， 那 么 ， 部署 流水 
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线 工 具 应 该 确保 它 来 自 上 游 部 署 流水 线 的 同一 个 实例 。 只 有 这 样 ， 我 们 对 该 制品 的 质量 信 
心 才能 随 着 部 署 流 水 线 的 前 进而 增加 。 例 如 ， 在 图 7-4 中 ， 构 建 号 为 521 的 部 署 流水 线 实例 
中 ， 其 内 部 发 布 阶 段 所 用 的 软件 包 就 是 同一 构建 号 521 的 提交 构建 阶段 生产 出 来 的 二 进 制 
产物 。 

2008 年 GoCD 的 所 有 代码 和 构建 安装 脚本 及 配置 信息 都 保存 在 同一 个 代码 库 中 。 每 次 
触发 部 署 流水 线 后 ， 如 果 该 实例 后 续 各 阶段 需要 前 面 阶段 的 构建 产物 ， 则 均 从 构建 产物 仓 
库 中 取出 ， 而 非 再 次 重新 构建 。 

即使 有 同一 个 部 署 流水 线 的 多 个 实例 正在 同时 运行 , 每 个 实例 中 后 续 各 阶段 所 用 的 人 
品 和 源 代 码 也 应 与 同一 部 署 流 水 线 实 例 前 面 阶段 的 版 本 和 出 处 保持 一 致 。 

2. 与 业务 逻辑 松 耦 合 

部 署 流水 线 工 具 应 该 与 具体 的 部 署 构建 业务 相 分 离 。 我 们 不 应 该 为 了 方便 实现 自动 
化 ,而 将 软件 代码 的 构建 和 部 署 过 程 与 所 选择 的 部 署 流水 线 工 具 紧 而 合 ,例如 将 一 些 软 件 
部 署 时 所 用 的 脚本 或 所 需 信息 由 部 署 流 水 线 平 台 保 存 。 相 反 ， 我 们 应 该 提供 单独 的 脚本 ， 
并 将 其 放 入 该 产品 的 代码 仓库 中 。 这 样 就 可 以 轻松 对 这 些 脚 本 的 修改 进行 跟踪 和 审核 。 

也 就 是 说 , 仪 仅 将 部 署 流 水 线 平台 工具 视 为 任务 的 调度 者 执行 者 和 记录 者 ， 它 只 需 
要 知道 部 署 流 水 线 中 各 种 任务 触发 与 调度 流程 ， 而 不 必 知 道 我 们 如 何 构 建 和 部 署 软件 。 

3. 并 行 化 原则 

在 部 署 流 水 线 的 设计 中 ， 我 们 也 应 该 尽 可 能 考虑 并 行 化 ,在 GoCD 的 部 署 流水 线 中 ， 
很 多 阶段 都 有 并 行 任务 。 例 如 ， 提 交 构 建 阶段 中 有 5 个 自动 化 测试 任务 ， 它 们 各 自 包 含 不 
同 的 测试 用 例 ， 在 不 同 的 计算 节点 上 运行 。 简 而 言 之 ， 应 该 尽早 提供 质量 反馈 信息 ， 从 而 
及 时 修正 发 现 的 问题 。 

如 果 任 何 资源 都 是 无 限 且 免费 使 用 的 , 那么 我 们 希望 每 一 次 变更 都 会 同时 触发 所 有 类 
型 的 测试 ， 而且 所 有 自动 化 测试 用 例 都 是 并 行 执行 。 如 此 一 来 ， 整 体 的 反馈 时 间 就 会 大 大 
缩短 。 

4. 快速 反馈 优先 

在 资源 不 足 的 情况 下 ， 部 署 流 水 线 应 该 让 那些 提供 快速 反馈 的 任务 尽早 执行 。 例 如 
GoCD 的 部 署 流水 线 中 , 单元 测试 放 在 了 端 到 端 功能 自动 化 测试 和 性 能 自动 化 测试 的 前 面 。 
这 是 反馈 速度 与 反馈 质量 之 间 的 一 种 权衡 。 为 了 确保 能 够 更 快 地 得 到 反馈 ,我 们 可 能 会 冒 
一 些 风险 ,优先 执行 那些 运行 速度 快 的 自动 化 验证 集合 ， 而 将 那些 运行 较 慢 、 消 耗资 源 较 
多 的 自动 化 验证 集合 放 在 后 面 执行 。 

5. 重要 反馈 优先 

对 于 反馈 机 制 ， 不 能 只 因 其 执行 速度 慢 ， 就 把 它 放 在 后 面 执行 。 这 一 条 与 前 面 看 似 矛 
盾 ， 但 在 某 些 情况 下 却 是 必要 的 质量 手段 。 














[二 























7.3 ”部 署 流 水 线 平 台 的 构成 97 





例如 , 软件 安装 包 的 安装 测试 虽然 运行 速度 比 单元 测试 速度 慢 , 但 其 反馈 更 加 真实 有 
价值 ， 也 应 该 放 到 流水 线 的 前 面 阶段 来 执行 ， 以 免 所 有 的 单元 测试 都 通过 以 后 才 发 现 软件 
无 法 部 署 启动 。 

7.2.2 团队 的 协作 纪律 


团队 协作 有 以 下 几 条 原则 。 

1. 立即 暂停 原则 

立即 暂停 原则 是 指 当 部 署 流水 线 运 行 时 ， 某 个 环 市 一 旦 出 了 问题 导致 执行 失败 ， 团 队 
应 该 立即 停 下 手中 的 任务 , 安排 人 员 着 手 开 始 修复 它 ， 而 不 是 放任 不 管 。 并 且 ， 在 问题 被 修 
复 之 前 ， 除 因 修 复 这 个 问题 而 提交 代码 以 外 ， 禁 止 其 他 人 再 向 代码 仓库 提交 新 的 代码 变更 。 

立即 暂停 原则 是 质量 内 建 理念 的 具体 体现 ， 它 借鉴 丰田 生产 系统 中 的 stop the line 原 
则 。 在 丰田 汽车 生产 线 上 ， 无 论 什 么 原因 ， 只 要 操作 者 无 法 高 质量 地 完成 他 的 工作 任务 ， 
他 就 可 以 拉 下 警示 灯 ， 让 整个 生产 线 停 下 来 ， 直 到 问题 被 解决 ， 详 见 第 4 章 的 相关 内 容 。 

GoCD 团 队 在 实践 部 署 流水 线 时 ， 也 采用 了 类 似 的 做 法 。 为 了 不 妨碍 团队 其 他 成 员 提 
交代 码 ， 若 提交 构建 阶段 失败 ， 提 交 者 在 10 分 钟 内 无 法 修复 问题 的 话 ， 应 该 回 深 代 码 。 

2. 安全 审计 原则 

角色 协作 时 ， 如果 要 传递 代码 或 软件 包 ， 那 么 它们 应 该 来 自 受 控 环 境 。 受 控 坏 境 是 指 
对 该 环境 的 一 切 操作 均 被 审计 ， 并且 在 该 环境 中 的 任何 组 件 (如 源 代码 、 二 进 制 代 码 包 或 
者 已 安装 的 程序 ) 均 已 通过 审计 。 每 个 部 署 流 水 线 实例 以 唯一 实例 编号 为 标识 ) 的 任何 
环 市 均 应 使 用 部 署 流 水 线 所 提供 的 制品 ， 其 产生 的 任何 产物 也 应 该 接受 受 控 管 理 。 例 如 ， 
测试 人 员 不 应 该 私自 拉 取 代码 ， 自 己 手 工 构建 软件 包 进 行 测 试 ， 也 不 应 该 接受 开发 人 员 通 
过 各 种 方式 〈 如 即时 通信 工具 ) 传递 的 软件 包 进行 测试 。 每 个 角色 对 交付 物 进行 验证 时 ， 
都 应 该 确保 该 交付 物 来 自 公 共 受 信 源 ， 即 统一 的 版 本 控制 仓库 或 制品 库 。 

尽 可 能 早 地 对 部 署 流水 线 产 物 进行 安全 审计 , 包括 在 构建 过 程 中 所 使 用 的 第 三 方 软件 
包 以 及 企业 内 其 他 团队 提供 的 类 库 或 软件 服务 。 


7.3 部署 流水 线 平台 的 构成 

企业 或 团队 需要 一 个 灵活 且 强 大 的 工具 平台 , 才能 快速 建立 自己 的 部 署 流水 线 。 那 么 ， 
这 个 工具 平台 应 该 包含 哪些 部 分 ， 需 要 具备 哪些 能 力 ， 才 能 称 为 灵活 且 强 大 呢 ? 接 下 来 我 
们 就 讨论 一 下 部 署 流水 线 平台 工具 链 的 主要 组 成 部 分 ， 以 及 应 当 具 备 的 基本 能 
7.3.1 工具 链 总 体 架 构 

部 署 流水 线 几 乎 贯穿 于 整个 持续 交付 “8” 字 环 中 的 验证 环 ， 涉 及 从 代码 提交 到 生产 
环境 部 署 的 整个 流程 。 支 撑 部 署 流水 线 的 平台 通常 由 一 系列 工具 组 合 而 成 。 这 个 部 署 流 水 
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线 工 具体 系 主要 分 为 3 部 分 。 第 一 部 分 是 “唯一 受信 源 ”， 它 是 部 署 流水 线 的 基础 ， 为 部 署 
流水 线 的 运行 提供 原材料 〈 即 代码 和 第 三 方 组 件 )， 也 用 于 保存 部 署 流水 线 运行 过 程 中 的 
产物 。 第 二 部 分 是 部 署 流 水 线 工 具 本 身 ， 负 责 各 种 任务 的 调度 与 结果 统一 展现 ， 通 过 与 其 
他 专项 工具 或 系统 相互 协作 ,完成 整个 交付 流程 ， 如 图 7-5 所 示 。 第 三 部 分 是 基础 支撑 服务 
层 ， 由 多 种 专门 工具 组 成 ， 提 供 软 件 的 构建 、 测 试 和 部 署 等 基础 能 
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图 7-5 ”部 署 流水 线 平台 的 架构 图 











1. 唯一 受信 源 
唯一 受信 源 是 团队 日 常 工作 过 程 中 所 需 信息 的 权威 仲裁 者 。 在 图 7-5 中 ， 底 部 的 3 个 仓 
库 (图 中 灰色 方 框 ) 就 是 企业 软件 生产 中 的 唯一 受信 源 。 当 不 同 角 色 对 某 一 信息 产生 质疑 














时 ， 都 应 该 能 够 追溯 到 唯一 受信 源 ， 并 以 其 为 标准 。 唯 一 受信 源 应 该 对 信息 之 间 的 关联 关 
系 进行 持久 化 。 例 如 ， 制 品 库 中 的 任意 制品 都 可 以 在 代码 仓库 源 找到 其 对 应 的 源 代码 。 而 
代码 仓库 中 的 信息 应 该 能 在 需求 /缺陷 管理 平台 中 找到 其 对 应 的 需求 出 处 。 

对 于 任何 环境 中 安装 并 运行 的 软件 〈 甚 至 包括 操作 系统 本 身 ) ， 我 们 都 应 能 在 制品 库 
中 找到 与 其 对 应 的 二 进 制 安装 包 , 以 及 它 所 依赖 的 其 他 二 进 制 包 。 即使 由 于 存储 空间 限制 ， 
也 应 该 能 够 找到 它 的 准确 出 处 ， 如 下 载 的 URI。 

代码 仓库 中 的 代码 也 应 该 从 需求 /缺陷 管理 平台 上 找到 相应 的 关联 关系 。 也 就 是 说 ， 
当 不 同 角 色 对 源 代码 是 否 满足 需求 验收 条 件 产 生 分 歧 时 ,都 应 该 可 以 在 需求 /缺陷 管理 平台 
上 找到 正确 无 二 义 性 的 答案 。 

2. 部 署 流水 线 平台 

根据 产品 团队 在 平台 上 对 其 自身 产品 流水 线 的 定义 , 部 署 流 水 线 平台 通过 一 定 的 形式 
连接 受信 源 与 不 同 基础 服务 ， 并 能 够 协调 和 调度 不 同 任务 ， 完 成 整个 交付 流程 运作 ， 并 能 
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够 展示 所 有 部 署 流水 线 进展 与 历史 信息 。 

3. 基础 支撑 服务 层 

一 个 有 历史 的 软件 企业 ， 很 可 能 已 经 具备 相应 的 基础 服务 (构建 、 测 试 、 部 署 )， 并 
且 根 据 原 有 职责 的 划分 ， 这些 基础 服务 已 经 分 布 于 不 同 的 职能 部 门 ， 很 可 能 还 会 有 重复 建 
设 的 问题 。 

例如 ， 测 试 部 门 管理 着 多 套 测试 环境 ， 运 维 部 门 则 严格 控制 着 生产 环境 。 与 此 同时 ， 
每 个 职能 部 门 都 定义 各 自 的 验证 体系 与 规范 。 例 如 ， 开 发 团队 要 求 自 测 和 代码 规范 ， 测试 
部 门 建立 了 自己 使 用 的 自动 化 测试 体系 ， 并 建设 自动 化 测试 用 例 集 ， 同 时 使 用 这 种 自动 化 
测试 体系 来 要 求 和 验证 开发 团队 的 软件 提 测 质量 标准 ; 运 维 部 门 也 会 建设 运 维 内 部 的 工具 
体系 平台 ， 达 到 提高 运 维 效率 、 降 低 工作 强度 的 目标 。 

当 我 们 的 软件 交付 模式 向 持续 交付 模式 改变 时 , 要 求 这 些 服务 管理 能 力 必 须 与 部 署 流 
水 线形 成 连通 ， 从 而 使 持续 交付 模式 的 收益 最 大 化 。 因 此 ， 我 们 需要 对 原 有 支撑 平台 进行 
一 系列 改造 ， 以 适应 部 署 流水 线 模式 。 


7.3.2 平台 应 当 具备 的 基本 能 


部 署 流水 线 平台 是 团队 多 角色 协作 的 中 枢 系 统 ， 其 关注 点 是 软件 自身 的 价值 流动 效 
率 ， 包含 从 代码 提交 到 部 署 上 线 的 全 流程 活动 信息 ， 能 够 准确 展现 部 署 流水 线 各 环节 的 状 
态 ， 并 在 不 增加 团队 负担 的 情况 下 自动 收集 各 环节 产生 的 衡量 数据 ， 并 对 价值 流动 的 效率 
进行 度量 。 例 如 ， 度 量 某 一 功能 的 开发 周期 时 间 (development cycle time) ， 即 从 某 一 功能 
特性 的 第 一 行 代码 提交 ， 到 该 功能 特性 发 布 到 生产 环境 (或 者 交付 到 客户 手中 ) 的 时 间 长 
度 ， 如 图 7-6 所 示 。 
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图 7-6” 某 个 需求 的 开发 周期 时 间 示意 图 


平台 要 具备 可 追溯 能 力 。 一 是 对 事件 的 追溯 能 力 ， 即 部 署 流水 线 中 发 生 的 任何 事件 都 
应 该 能 够 扎 滴 ,包括 : 什么 人 ? 在 什么 时 间 ? 执行 了 什么 操作 ? 为 什么 执行 ? 以 及 操作 过 
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程 与 相应 的 脚本 是 什么 ”只 有 这 样 ， 才 能 支持 良好 的 安全 审计 工作 。 另 外 ， 也 有 利于 快速 
定位 和 缺陷 分 析 ， 或 者 帮助 诊断 线 上 问题 。 二 是 对 部 署 流水 线 产物 的 追溯 能 力 。 这 些 信 息 
包括 部 署 流水 线 的 任意 产物 、 其 对 应 的 源 ， 构 建 时 的 脚本 与 环境 ， 以 及 其 所 依赖 的 其 他 组 
件 及 相应 的 版 本 信息 等 。 

平台 要 具有 对 历史 构建 进行 重建 的 能 力 。 一 个 极端 的 场景 就 是 当 一 个 旧 的 软件 版 本 出 
现 了 生产 问题 以 后 ,即便 在 产品 仓库 中 已 经 找 不 到 对 应 的 二 进 制 安装 包 ， 只 要 唯一 受信 源 
的 内 容 无 损 ， 部署 流水 线 平 台 就 可 能 马上 找到 当时 的 部 署 流 水 线 配置 ， 并 再 次 重建 这 个 旧 
版 本 。 另 外 ， 我 们 经 常会 遇 到 需要 重新 执行 部 署 流 水 线 中 个 别 环节 的 场景 。 例 如 ， 如 果 你 
怀疑 某 次 的 自动 化 测试 失败 是 由 于 运行 环境 相关 因素 导致 的 , 那么 你 可 能 就 希望 重新 运行 
这 个 环节 。 

7.3.3 ”工具 链 建设 策略 

虽然 图 7-5 是 以 较 高 的 抽象 层次 来 描述 持续 交付 部 署 流水 线 平 台 架 构 ， 但 并 不 是 说 它 
是 一 个 巨石 架构 。 事 实 上 ， 它 由 很 多 不 同 的 工具 与 子 系统 整合 而 成 。 由 于 每 个 公司 所 使 用 
的 技术 架构 、 开 发 语言 、 运 维 方式 等 都 有 所 不 同 ， 因 此 所 用 的 工具 也 会 有 所 差异 。 

对 创业 公司 或 小 型 公司 来 说 ， 由 于 团队 人 员 规 模 小 ， 业 务 场 景 相 对 单一 ， 软 件 架构 不 是 
特别 复杂 , 因此 通过 相关 领域 的 开源 工具 拼装 , 就 可 以 建立 适合 自己 团队 的 部 署 流水 线 平台 。 

对 有 一 定 历史 的 中 型 公司 来 说 ， 遗 留 系统 和 代码 增多 ;并 有 一 定 的 工具 基础 ， 可 能 就 
需要 自己 开发 一 些 工 具 实现 一 些 定制 化 需求 ， 从 而 解决 某 些 领域 的 特定 问题 ， 以 便 提 高 管 
理 效率 。 例 如 ， 当 自动 化 测试 用 例 数量 较 多 时 ， 就 可 能 需要 增加 自动 化 测试 用 例 的 管理 与 
分 发 系统 。GoCD 团 队 自动 化 测试 用 例 较 多 后 ， 就 自行 开发 了 一 个 自动 化 测试 用 例 自动 分 
组 插件 ， 由 该 插件 自动 将 所 有 测试 用 例 分 配 到 不 同 任务 里 ， 并 将 这 些 任务 分 配 到 多 个 测试 
环境 中 并 行 执 行 。 

但 对 大 型 公司 来 说 , 其 软件 产品 的 运行 环境 更 加 复杂 ,各 产品 组 件 之 间 的 关联 关系 更 
加 复杂 ， 数 量规 模 也 比较 大 ， 因 此 定制 化 需求 会 更 高 。 为 了 发 挥 持续 交付 的 威力 ， 各 类 支 
撑 服 务 的 云 化 管理 也 成 了 必 选 项 。 例 如 ， 亚 马 逊 、 谷 歌 、Facebook 和 网 飞 公司 等 都 开发 了 
自己 的 持续 交付 部 署 流 水 线 平台 工具 链 ， 甚 至 将 其 中 的 部 分 工具 贡献 给 了 开源 社区 。 

部 署 流水 线 平台 本 身 只 是 用 于 软件 部 署 流 水 线 的 定义 与 任务 调度 , 以 及 当前 状态 的 展 
现 , 具体 任务 的 执行 均 应 由 基础 支撑 服务 承担 。 而 这 些 基 础 支撑 服务 之 间 也 有 相互 的 关联 
关系 , 一 个 系统 的 输入 可 能 就 是 另 一 个 系统 的 输出 。 下 面 让 我 们 从 部 署 流水 线 中 流动 的 内 
容 来 理解 这 些 系 统 之 间 的 关联 关系 。 


7.4 基础 支撑 服务 的 云 化 
业界 领先 互联 网 公司 的 服务 端 程序 部 署 频率 都 非常 快 ， 如 表 7-1 所 列 。 这 些 公司 都 寻 
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立 了 自己 的 云 化 基础 支撑 服务 ， 以 便 支持 公司 内 的 大 规模 持续 交付 实践 ， 并 鼓励 使 用 统一 
平台 和 工具 , 在 提升 交付 效率 的 同时 , 也 提高 资源 利用 率 , 降低 管理 成 本 。 有 些 公司 认为 ， 
内 部 工具 反正 是 给 内 部 员工 用 的 , 只 要 能 用 就 行 , 使 用 体验 如 何 、 是 否 需 要 统一 都 不 重要 。 
然而 ， 在 持续 交付 模式 下 ， 不 好 用 的 工具 会 对 效率 产生 很 大 的 影响 。 亚 马 进 早 在 2006 年 就 
认识 到 了 这 一 点 ， 在 功能 性 和 易 用 性 方面 ， 其 公司 内 部 的 支撑 工具 平台 在 业界 也 可 以 算数 
一 数 二 ， 让 亚马逊 电 商 这 个 超级 庞大 复杂 的 网 站 流畅 运行 。 其 所 有 工具 在 全 公司 范围 内 统 
一 使 用 ， 更 新 及 时 且 统 一 ， 有 专门 的 团队 负责 开发 和 维护 。 


表 7-1 业界 TOP 互 联网 公司 的 网 站 部 署 频率 
(资料 来 源 : 《凤凰 项 目 : 一 个 IT 运 维 的 传奇 故事 》) 
































公司 部 署 频率 部 署 效率 
亚马逊 23000 次 /天 分 钟 级 
谷歌 5500 次 /天 分 钟 级 
网 飞 (Netflix) 500 次 /天 分 钟 级 
Facebook 2 次 /天 分 钟 级 
Twitter 3 次 / 周 小 时 级 








7.4.1 基础 支撑 服务 的 协作 过 程 解析 

为 了 能 够 更 好 地 了 解 各 类 基础 支撑 服务 系统 的 定位 与 职责 , 让 我 们 先 以 一 个 简单 部 署 
流水 线 (如 图 7-7 所 示 ) 的 运行 示例 来 说 明 持续 交付 部 署 流水 线 平台 工具 链 中 各 种 基础 支撑 
服务 之 间 的 协作 过 程 。 


i 
代码 库 提交 构建 次 级 构建 生产 部 署 











图 7-7 部 署 流 水 线 示 例 


这 个 部 署 流水 线 只 包含 3 个 阶段 ,分 别 是 “提交 构建 阶段 ”“ 次 级 构建 阶段 ”和 “部 署 
生产 环境 阶段 "。 其 中 ， 提 交 构 建 阶段 包括 构建 打包 、 单 元 测试 和 代码 规范 检查 ， 次 级 构 
建 阶段 包括 端 到 端 自 动 化 测试 ; 部 署 生产 环境 阶段 就 是 直接 将 成 功 通过 前 两 个 阶段 的 代码 
部 署 到 生产 环境 中 。 各 阶段 之 间 为 自动 触发 关系 ， 如 图 7-7 所 示 。 

平台 中 所 有 相关 系统 的 协作 信息 都 会 经 部 署 流水 线 平台 展示 出 来 。 但 是 , 为 了 让 示意 
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图 更 简洁 , 图 7-8 中 没有 画 出 部 署 流水 线 平台 的 调度 操作 。 粗 线 箭头 的 方向 就 是 部 署 流水 线 
的 推进 方向 ， 带 圈 的 序号 表示 部 署 流 水 线 中 不 同 的 阶段 活动 ,“0” 表 示 各 种 基础 环境 的 初 
始 准备 活动 。 所 有 配置 与 描述 信息 及 代码 都 来 自 代 码 仓库 ， 二 进 制 包 在 第 一 次 构建 生成 后 
就 被 放 和 二进制 管理 库 ， 并 被 后 续 两 个 环节 重复 利用 ， 不 必 再 次 构建 生成 。 
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i 
DO 
图 7-8 ”部 署 流水 线 的 一 次 执行 过 程 示 意图 


。 第 0 步 : 环境 准备 。 运 维 部 门 提供 的 基础 环境 管理 服务 从 代码 库 中 获取 某 产 品 基 
础 环境 要 求 后 ， 自 动 为 团队 准备 部 署 流 水 线 运行 所 需要 的 基础 环境 ， 如 用 于 编译 
打包 的 构建 环境 、 单 元 测试 用 的 测试 环境 、 手 工 验 收 测 试 的 UAT 环 境 ， 甚 至 生产 
环境 。 

。 第 1 步 : 提交 构建 。 提 交 构 建 阶段 不 但 包括 软件 的 编译 打包 ， 还 包括 基本 的 软件 包 
验证 ， 如 单元 测试 、 代 码 规范 扫描 和 安装 包 验 证 测试 等 。 因 此 ， 构 建 包 管理 服务 
从 代码 库 中 取出 源 代 码 ， 在 构建 环境 中 构建 打包 后 ， 放 和 制品 库 。 然 后 ， 部 署 包 
管理 服务 根据 流水 线 的 定义 将 编译 好 的 产物 放 到 测试 环境 中 。 和 车 测试 过 程 需 要 一 
些 特 殊 配置 ， 则 同时 从 源 代码 库 中 拉 取 测试 部 署 配置 。 部 署 成 功 后 ， 执 行 流水 线 
指定 的 测试 任务 ， 最 终 返 回 测 试 是 否 成 功 的 信号 。 

。 第 2 步 : 次 级 构建 。 部 署 包 管理 服务 从 制品 库 中 取出 第 1 步 生成 的 二 进 制 包 ， 并 从 
代码 库 中 取出 UATI 部 署 配置 信息 ， 将 二 者 结合 后 ， 部 署 到 UAT 环 境 ， 运 行 端 到 端 
自动 化 测试 用 例 。 结 束 后 ， 返 回 是 否 成 功 的 标记 。 

。 第 3 步 : 部 署 生产 环境 。 部 署 包 管理 服务 从 制品 库 中 取出 第 1 步 生成 的 二 进 制 包 ， 
并 从 代码 库 中 取出 生产 部 署 配置 信息 ， 将 二 者 结合 后 ， 部 署 到 生产 环境 。 
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最 简 流 水 线 一 一 IMVU 每 日 50 次 部 团 
IMVU 是 一 个 以 3D 人 物 为 特性 的 陌生 人 社交 与 游戏 应 用 创业 公司 ， 成 立 于 2004 年 ， 
截止 到 2009 年 ， 其 开发 工程 师 约 为 90 人， 但 其 每 日 生产 部 署 次 数 达到 50 次 。 其 部 署 流水 
线 只 有 两 个 阶段 ， 即 “提交 构建 ”和 “生产 环境 部 署 *， 并 且 都 是 自动 触发 ， 自 动 化 测 
试 套件 在 30 ~ 40 人 台 机 器 上 并 行 执行 ， 一 共 需 要 运行 9 分 钟 ， 生 产 环境 部 署 需 要 6 分 钟 。 这 
两 个 步骤 是 连续 进行 的 ， 这 也 意味 着 每 9 分 钟 就 会 向 网 站 推送 一 次 新 的 代码 修订 版 本 ， 
即 一 个 小 时 之 内 可 以 部 署 6 次 。 平 均 每 天 部 署 530 次 之 多 。 


现在 , 我 们 已 经 了 解 了 各 基础 支撑 服务 之 间 的 协作 过 程 ， 接 下 来 我 们 分 别 讲解 不 同系 
统 的 逻辑 结构 。 
7.4.2 ”编译 构建 管理 服务 


构建 管理 服务 包括 构建 的 任务 管理 、 调 度 、 构 建 集群 管理 及 构建 执行 器 ， 如 图 7-9 
所 示 。 

















构建 请 求 











图 7-9 ”构建 管理 服务 架构 示意 图 


任务 管理 服务 包括 两 个 子 服务 ,一 个 是 接收 子 服务 ， 另 一 个 是 通知 子 服务 。 接 收服 务 
是 指 从 开发 者 个 人 或 者 部 署 流水 线 (或 持续 集成 服务 器 ) 向 其 发 送 构建 任务 请 求 ， 记 录 构 
建 请 求 的 相关 信息 《请 求 者 、 请 求 任务 内 容 与 类 型 )， 并 将 其 加 入 待 构建 队列 中 。 通 知 服 
务 是 指 从 已 构建 完成 任务 列表 中 取出 相关 信息 ， 及 时 通知 任务 发 起 人 有 关 构建 任 务 的 结果 
信息 。 

调度 服务 负责 从 待 构建 任务 列表 中 , 根据 一 定 的 调度 算法 选择 构建 任务 ， 并 将 其 发 送 
到 相应 的 构建 机 上 执行 构建 ， 例 如 C++ 代码 的 构建 任务 应 该 发 送 到 有 对 应 C++ 编译 环境 的 
机 器 上 。 

集群 管理 服务 负责 对 各 类 构建 环境 的 管理 ,包括 编译 各 类 构建 环境 的 建立 与 销毁 、 环 
况 的 状态 管理 (繁忙 、 空 间 、 失 去 连接 )。 
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执行 器 是 执行 构建 任务 的 代理 , 在 集群 中 有 很 多 个 执行 器 ,其 至 一 个 计算 节点 可 以 有 
多 个 执行 器 。 每 个 执行 器 需要 根据 接收 到 的 信息 从 对 应 的 代码 仓库 URI 检 出 代码 ， 并 根据 
要 求 进行 编译 构建 。 当 构建 任务 完成 之 后 ， 根 据 任务 信息 将 指定 的 产物 放 到 构建 描述 中 指 
定 的 位 置 (通常 为 企业 的 制品 库 ) ， 并 向 调度 服务 汇报 执行 结果 。 执 行 器 本 身 并 不 真正 执 
行 任务 ， 而 是 调用 专门 的 构建 工具 来 执行 ， 例 如 对 应 Java 语 言 项 目的 构建 工具 有 Ant、 
Maven、Gradle 等 。 

目前 很 多 开源 持续 集成 服务 器 (如 Jenkins、GoCD) 都 提供 相应 的 调度 管理 功能 ， 
部 分 情况 下 已 能 够 满足 中 小 企业 需求 。 只 有 当 企业 比较 大 、 构 建 任务 比较 多 的 情况 下 ， 才 
需要 自己 定制 构建 管理 系统 。 您 可 能 注意 到 , 在 图 7-9 中 , 构建 请 求婚 有 来 自 部 署 流水 线 的 
请 求 ， 也 有 来 自 工 程 师 的 请 求 。 这 表示 ， 该 构建 管理 服务 也 支持 工程 师 在 未 提交 代码 前 ， 
就 利用 它 进 行 个 人 构建 。 这 令 工 程 师 在 本 地 编写 代码 期 间 ， 就 可 以 利用 这 种 强大 的 服务 能 
力 。 在 第 16 音 的 案例 中 ， 就 使 用 了 类 似 做 法 ， 用 于 提升 持续 集成 六 步 提 交 法 中 个 人 构建 的 
反馈 速度 。 

事实 上 , 每 种 基础 支撑 服务 都 应 该 支持 这 种 工作 模式 ， 从 而 最 大 化 利用 资源 ， 提 升 质 


量 反馈 速度 。 
7.4.3 自动 化 测试 管理 服务 


测试 管理 服务 包括 测试 任务 管理 服务 、 测 试用 例 调度 服务 sj 测试 集群 管理 服务 。 对 于 
有 大 量 自动 化 测试 用 例 的 公司 ， 可 能 还 要 有 用 例 健康 管理 自动 化 服务 。 
测试 任务 管理 服务 与 构建 任务 管理 服务 类 似 ， 也 是 用 于 接收 任务 和 反馈 任务 执行 结 
果 ， 包 括 任务 接收 子 服 务 和 任务 反馈 子 服务 。 
测试 用 例 调度 服务 负责 根据 一 定 的 调度 算法 从 任务 管理 服务 中 选择 测试 任务 执行 。 这 
个 调度 服务 有 两 种 工作 模式 : 一 种 是 顺序 执行 测试 用 例 ， 即 将 所 有 测试 用 例 分 配 到 符合 测 
试 条 件 的 一 台 测 试 设备 上 执行 ; 另 一 种 是 并 行 执行 测试 用 例 , 即将 测试 用 例 分 成 数 个 子 集 ， 
将 其 分 发 到 多 台 测 试 设备 上 执行 。 

测试 集群 管理 服务 与 构建 管理 服务 中 的 集群 管理 服务 职责 类 似 , 包括 测试 环境 的 建立 
与 销毁 、 测 试 环境 的 状态 管理 (繁忙 、 空 间 、 失 去 连接 )。 但 是 ， 其 管理 的 集群 类 别 会 更 
多 一 些 ， 如 单元 测试 集群 、 功 能 测试 集群 、 性 能 测试 集群 等 。 另 外 ， 由 于 每 条 产品 线 所 需 
的 测试 环境 可 能 存在 差异 ， 因 此 还 需要 按 产品 线 再 进行 细 分 。 

对 执行 大 量 自动 化 测试 用 例 来 说 ,测试 用 例 本 身 不 稳定 也 会 成 为 一 个 比较 严重 的 问题 。 
一 些 公司 会 建立 测试 用 例 健康 管理 服务 。 例 如 ， 按 照 一 定 的 规则 来 自动 判断 某 个 用 例 是 否 
为 不 稳定 测试 用 例 。 若 被 判定 为 不 稳定 用 例 ， 就 将 其 从 健康 测试 用 例 集 中 移出 ， 放 入 不 稳 
定 用 例 凶 。 那 么 ， 当 下 次 正常 调用 原 测 试用 例 集 时 ， 该 不 稳定 测试 用 例会 被 自动 排除 在 外 。 

与 此 同时 ， 用 例 健康 管理 服务 还 会 对 不 稳定 用 例 池 中 的 用 例 以 不 同 的 策略 进行 检查 
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(例如 ， 将 该 用 例 在 不 同 的 网 络 节 点 、 不 同 的 节点 资源 的 条 件 下 ， 连 续 重 复 执 行 100 次 )。 
如 果 仍 旧 有 超过 一 定数 量 的 失败 次 数 ， 就 认定 该 用 例 为 非常 不 稳定 用 例 ， 通 知 该 测试 用 例 
的 归属 团队 进行 处 理 ， 如 图 7-10 所 示 。 


名 











流水 线 平台 














图 7-10 ”自动 化 测试 管理 服务 架构 示意 图 
7.4.4 软件 部 署 管理 服务 


我 们 常会 遇 到 “软件 在 测试 环境 和 预 生产 环境 中 的 测试 都 没有 问题 ， 但 是 到 了 生产 环 
这 就 会 出 错 ” 的 现象 。 其 中 一 个 主要 原因 就 是 生产 环境 与 测试 环境 的 差异 导致 的 。 例 如 ， 
十 儿 年 前 , 国内 很 多 大 型 企业 的 生产 环境 中 用 的 J2EE 应 用 服务 器 都 是 商业 软件 。 由 于 它们 
过 于 笨重 ,使 得 开发 人 员 和 测试 人 员 在 调试 或 测试 期 间 都 喜欢 使 用 Tomcat 作 为 服务 器 。 而 
Tomcat 对 语法 检查 并 不 严格 ,但 商业 软件 却 非 常 严格 。 因 此 ，Web 应 用 上 线 之 后 ， 总 是 有 
一 些 页 面 因 Html 标 签 不 匹配 而 报错 。 这 就 是 由 于 环境 不 一 致 导致 的 。 

另外 , 运 维 部 门 与 产品 研发 团队 之 间 的 责任 冲突 由 来 已 入。 运 维 部 门 负责 生产 环境 的 
稳定 性 ， 产 品 研发 团队 负责 开发 新 功能 。 他 们 之 间 的 接口 是 一 个 正式 产品 仓库 。 产 品 研 发 
团队 将 验收 合格 的 软件 包 放 入 这 个 正式 产品 仓库 ， 即 算 完 成 了 研发 任务 。 接 下 来 由 运 维 部 
门 从 这 个 生产 仓库 中 取出 该 软件 包 ， 并 根据 研发 团队 提供 的 上 线 部 署 清单 ， 将 其 部 署 到 生 
产 环 境 中 ， 如 图 7-11 所 示 。 

在 持续 交付 工作 模式 下 ， 所 有 人 应 该 使 用 相同 的 工具 集 。 任 何人 只 要 获得 授权 ， 他 
就 可 以 一 键 发 出 部 署 指 令 ， 而 部 署 管理 服务 接收 到 指令 后 ， 根 据 其 中 描述 的 不 同 环境 部 
署 配置 信息 ， 在 指定 的 环境 部 署 指 定 的 软件 包 ， 这 些 环境 包括 开发 测试 环境 、 测 试 环 境 、 
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预 生 产 环 境 和 生产 环境 。 


生产 环境 
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图 7-11 开发 与 运 维 的 部 门 墙 


此 时 ,部署 管 理 服务 负责 接受 来 自 不 同方 的 部 署 请 求 ， 分 别 从 制品 库 中 获得 指定 软件 
包 ， 从 代码 仓库 中 获取 部 署 脚本 与 配置 文件 ， 并 根据 其 中 的 部 署 描 述 ， 将 该 软件 包 分 发 到 
指定 运行 的 节点 上 ， 将 其 正确 安装 后 ， 启 动 服务 。 目 前 市 场 上 已 有 很 多 部 署 管 理工 具 如 
Puppet/Chaf/Ansible/SaltStack 等 ， 能 够 与 部 署 流 水 线 平台 协同 工作 ， 完 成 环境 部 署 任务 。 


7.4.5 ”基础 环境 管理 服务 


基础 环境 管理 服务 为 上 面 3 种 管理 服务 (构建 管理 一 测试 管理 、 部 署 管理 ) 提供 环境 
准备 、 管 理 和 监控 服务 。 它 会 接受 来 自 构建 、 测 试 和 部 署 管理 服务 的 请 求 ， 根 据 请 求 描述 
为 其 准备 相应 的 基础 环境 , 如 图 7-12 所 示 。 环境 管理 服务 接 到 3 个 前 端 服务 的 请 求 后, 根据 


















































软件 包 仓库 





图 7-12 ”基础 环境 管理 服务 示意 图 
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相关 的 信息 ， 从 代码 仓库 、 镜 像 仓 库 、 软 件 包 仓库 获取 所 需 内 容 ， 经 过 加 工 后 得 到 所 需 环 
并 。 将 其 放 到 对 应 的 集群 中 ， 并 发 出 通知 即 可 。 

基础 环境 管理 服务 由 技术 运 维 团队 负责 ， 且 不 直接 为 研发 团队 提供 服务 。 研 发 团队 仅 
与 构建 服务 、 测 试 服务 和 部 署 服务 打交道 。 

随 着 Docker 技 术 的 成 熟 ， 越 来 越 多 的 公司 开始 使 用 这 一 技术 ,使 得 环境 准备 工作 大 为 
简化 ， 可 以 直接 将 软件 应 用 、 配 置 与 基础 环境 构建 为 一 个 Docker 镜 像 ， 在 部 署 时 直接 拉 取 
并 启动 已 经 生成 的 Docker 镜 像 即 可 。 


7.5 企业 制品 库 的 管理 











企业 制品 库 是 部 署 流水 线 工具 链 中 的 企业 受信 源 之 一 , 也 是 企业 信息 安全 管理 中 很 重 
要 的 一 个 节点 。 只 有 通过 安全 审计 的 二 进 制 软件 包 才 能 被 纳入 企业 制品 库 ， 而 且 安全 审计 
部 门 应 当 定期 对 其 中 存储 的 内 容 进 行 安全 扫描 ， 及 时 清理 存在 安全 隐患 的 二 进 制 软 件 包 。 


7.5.1 制品 库 的 分 类 
制品 库 (artifact repository) 的 类 型 如 表 7-2 所 示 。 


表 7-2 企业 内 制品 库 的 分 类 


















































企业 内 部 

制 品 库 和 企业 外 部 
临时 正式 

软件 包 库 和 A B x 

镜像 库 C D Y 











1. 临时 软件 包 库 A 

企业 内 部 的 临时 软件 包 库 用 于 存储 企业 内 部 团队 开发 的 通过 部 署 流水 线 生 成 代码 的 
所 有 软件 包 ， 例 如 每 次 触发 构建 后 产生 的 二 进 制 包 。 该 仓库 中 的 二 进 制 包 不 能 被 直接 部 署 
到 生产 环境 。 如 果 存 在 存储 空间 的 限制 问题 ， 则 临时 软件 包 库 的 内 容 可 以 被 清理 。 

2. 正式 软件 包 库 B 

正式 软件 包 库 用 于 存储 那些 经 过 部 署 流水 线 验 证 , 被 确认 能 够 且 将 要 被 发 布 到 生产 环 
境 (或 用 户 手 中 ) 的 软件 包 。 一旦 经 过 确认 ， 这 些 软 件 包 就 应 该 从 临时 软件 产物 库 移动 到 
正式 产品 库 中 。 正 式 软件 包 库 中 所 存储 的 软件 包 应 该 被 一 直 保 存 ， 直 至 退 市 。 

3. 外 部 软件 包 库 X 

外 部 软件 包 库 是 指 该 软件 包 的 源 代 码 不 是 由 企业 自身 团队 管理 和 维护 , 但 是 企业 在 研 
发 自己 的 软件 产品 过 程 中 所 用 到 的 软件 制品 。 这 些 软件 制品 由 企业 从 互联 网 或 第 三 方 机 构 
获得 ， 并 保存 到 外 部 软件 包 库 中 。 























108 第 7 章 部 署 流水 线 原则 与 工具 设计 





外 部 软件 包 库 中 的 存储 形式 可 能 包括 3 种 : 第 一 种 是 直接 以 二 进 制 形式 保存 ， 第 二 种 
是 以 源 代码 副本 的 方式 保存 ; 第 三 种 是 以 外 部 链接 地 址 的 形式 保存 ， 即 仅 记 录 该 外 部 软件 
包 的 互联 网 下 载 地 址 ， 当 有 人 需要 时 ， 通 过 该 外 部 链接 地 址 获取 。 

在 企业 内 部 建立 统一 管理 的 外 部 软件 包 库 ， 其 目的 有 3 个 : 一 是 方便 快捷 ， 在 企业 内 
部 保存 这 些 软件 包 后 ， 内 部 人 员 可 以 比较 方便 从 内 网 获取 ， 而 不 需要 连接 外 网 ， 二 是 统一 
审计 ， 内 部 团队 仅 从 该 库 中 获取 外 部 软件 包 ， 容 易 管 理 控制 ， 避 免 同一 软件 的 多 种 版 本 却 
有 很 多 种 不 同 来 源 ， 也 避免 内 部 人 员 违 规 使 用 不 安全 的 版 本 ， 三 是 保证 安全 ， 由 于 所 需 的 
外 部 软件 包 全 部 在 这 里 ， 因 此 企业 可 以 对 其 进行 安全 检查 ， 以 确保 企业 自己 的 软件 产品 不 
会 因 不 安全 的 外 部 包 而 出 现 问 题 ， 即 使 市 场 上 发 现 某 个 外 部 软件 包 存 在 安全 隐患 ， 也 能 够 
立即 采取 措施 ， 通 知 内 部 团队 打 补 丁 或 替换 。 

4. 临时 镜像 库 C、 正 式 镜 像 库 D 与 外 部 镜像 库 Y 

这 3 个 镜像 库 与 上 面 的 软件 包 库 的 职责 类 似 ， 只 是 保存 的 内 容 有 所 不 同 。 我 们 可 以 将 
其 中 保存 的 镜像 看 作 是 一 种 特殊 形态 的 软件 包 ， 使 用 相同 方式 进行 管理 即 可 。 


7.5.2 制品 库 的 管理 原则 


在 企业 制品 库 中 ， 每 一 个 制品 都 应 该 有 唯一 标识 区 并 县 连 同 其 来 源 、 组 成 部 件 以 及 用 
途 等 ， 一 起 保存 为 该 制品 的 元 信息 。 所 有 制品 都 可 以 追 斋 至 源头 ， 包 括 临时 制品 库 中 的 制 
品 。 无 论 何 时 何 地 ， 通 过 制品 的 唯一 标识 ， 任 何人 从 制 章 库 获 取 的 制品 都 是 相同 的 。 如 果 
制品 库 中 的 制品 本 身 被 删除 或 丢失 ， 那 么 企业 可 以 根据 其 保留 在 制品 库 中 的 元 信息 描述 ， 
通过 原 有 的 部 署 流水 线 再 次 生成 与 原来 相同 的 制品 。 


7.6 多 种 多 样 的 部 署 流水 线 


由 于 软件 产品 所 在 行业 不 同 ， 产 品 本 身 的 形态 不 同 ， 负 责 研 发 的 团队 人 员 组 成 不 同 ， 
源 代码 的 版 本 管理 分 支 策略 不 同 ， 使 用 的 部 署 流水 线形 式 也 会 各 不 相同 。 


7.6.1 多 组 件 的 部 署 流水 线 


如 果 一 个 软件 产品 由 多 个 组 件 构建 而 成 , 每 个 组 件 均 有 独自 的 代码 仓库 , 并 且 每 个 组 
件 由 一 个 单独 的 团队 负责 开发 与 维护 ， 那 么 ， 整 个 产品 的 部 署 流水 线 的 设计 通常 与 图 7-13 
相似 。 每 个 组 件 的 部 署 流水 线 成 功 以 后 ， 都 能 触发 下 游 的 产品 集成 部 署 流 水 线 。 这 个 集成 
部 署 流 水 线 的 集成 打包 阶段 将 自动 从 企业 软件 包 库 中 获取 每 个 组 件 最 近 成 功 的 软件 包 , 对 
其 进行 产品 集成 打包 ， 并 触发 集成 部 署 流水 线 的 后 续 阶 段 。 
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产品 多 组 件 部 署 流水 线 


i \ 
CEC 提交 构建 、》 次 级 构建 、》 
pe / 3 
! 企业 产品 库 
is 


' E 
提交 构建 》 次 级 构建 、 
/ 产品 集成 部 署 流水 线 的 








ET 提交 构建 》 次 级 构建 De 艇 沪 。 集 成 打包 >》 自动 验证 》 手 工 验证 >》 外 部 体验 > 上传 发 布 > 


1 - 
二 提交 构建 Si 
A/ 


Eis 提交 构建 ”》 次 级 构建 、 


oe 企业 软件 包 库 


图 7-13 ”多 组 件 聚 合 的 部 署 流水 线 
7.6.2 个 人 部 署 流水 线 


GoCD 使 用 分 布 式 版 本 管理 工具 Mecurial 以 后 ,每 名 工程 师 都 创建 了 自己 专属 的 部 署 流 
水 线 ,， 用 于 个 人 在 未 推送 代码 到 团队 仓库 之 前 的 快速 质量 反馈 。 个 人 部 署 流 水 线 并 不 会 部 
署 到 团队 共同 拥有 的 环境 中 ， 而 是 仅 覆 盖 个 人 开发 环节 ， 如 图 7-14 所 示 。 
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每 名 工程 师 均 通过 部 署 流 水 线 提 供 的 模板 功能 克隆 一 份 团队 部 署 流 水 线 , 将 其 他 阶段 
全 部 删除 ， 仅 保留 前 面 两 个 阶段 ， 即 “提交 构建 ”和 “次 级 构建 ”的 内 容 。 令 这 个 部 署 流 
水 线 监听 工程 师 自己 的 代码 仓库 代码 变化 ， 并 自动 化 触发 。 每 当 开 发 人 员 提 交代 码 到 个 人 
仓库 时 ， 都 会 自动 触发 其 个 人 专属 的 部 署 流 水 线 。 

这 样 做 的 收益 有 以 下 3 个 。 

(1) 该 部 署 流水 线 与 团队 部 署 流水 线 共享 构建 和 测试 集群 环境 。 由 于 这 些 环境 是 统 
一 管理 的 ， 因 此 能 够 确保 任何 时 刻 ， 每 个 人 的 构建 与 自动 化 测试 环境 均 与 团队 所 属 的 环 
噶 一 致 。 

(2) 保证 每 名 工程 师 都 能 利用 更 强大 的 测试 资源 ， 加 快 个 人 验证 的 速度 。 

(3) 个 人 部 署 流 水 线 运 行 的 测试 用 例 与 团队 部 署 流 水 线 前 两 个 阶段 的 验证 集合 相同 ， 
假如 团队 部 署 流 水 线 出 现 构 建 失败 ， 则 容易 定位 问题 ， 例 如 工程 师 遗 漏 文 件 未 提交 。 
7.6.3 ”部 署 流水 线 的 不 断 演进 

如 果 你 认为 GoCD 团 队 的 部 署 流 水 线 一 直 是 本 章 开始 介绍 的 那样 ， 没 有 任何 变化 ， 你 
就 错 了 。 随 时 间 的 推移 ， 部 署 流 水 线 也 应 该 随 着 产品 的 发 展 而 演进 。 截 止 到 2018 年 4 月 ， 
GoCD 的 社区 版 本 每 个 月 发 布 一 次 正式 版 ， 其 部署 流水 线 设计 也 已 经 发 生 了 很 大 的 改变 ， 
如 图 7-15 所 示 。 





















构建 
Windows 包 用 布 基于 






构建 
Linux 包 


一 一 > 表示: 触发 关系 
品 天: fg 证 
| >》 表示 : 部 署 流水 线 
图 7-15 ”复杂 的 部 署 流水 线 设 计 
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在 图 7-15“ 构 建 Linux 包 ”这 个 部 署 流 水 线 中 ， 包 含 两 个 阶段 。 第 一 个 阶段 是 
“build-no_server” 。 在 这 个 阶段 ， 一 共有 39 个 任务 并 行 执行 ， 既 并 行 构建 组 成 Server 所 需 的 
多 个 Jar 包 ,也 并 行 执行 Java 测 试用 例 和 JavaScript 单 元 测试 用 例 。 这 体现 了 部 署 流水 线 “ 尽 
量 并 行 化 ”原则 。 第 二 个 阶段 是 “build-server”, 使 用 经 第 一 个 阶段 已 初步 验证 通过 的 多 个 
Jar 包 组 装 成 Server 包 。 

在 图 7-15“Linux 验 收 测 试 ” 这 个 部 署 流水 线 中 ,也 包含 两 个 阶段 。 第 一 个 阶段 是 运行 
高 优先 级 的 功能 测试 , 第 二 个 阶段 是 对 插件 部 分 的 自动 化 功能 测试 ， 这 体现 了 部 署 流水 线 
的 “快速 反馈 优先 ”原则 。 

而 在 后 续 的 各 类 测试 (如 验收 测试 、 回 归 测 试 或 者 功能 测试 ) 中 ， 被 测试 的 二 进 制 包 
均 来 自前 面 各 部 署 流水 线 的 产 出 物 ， 而 且 确 保 其 使 用 同一 源 代码 版 本 。 

在 性 能 测试 部 署 流 水 线 中 ， 共 包含 8 个 阶段 ， 它 们 分 别 是 生成 测试 用 脚本 、 准 备 测试 
环境 、 启 动 Server、 启 动 Agent、 配 置 用 例 、 等 待 就 绕 、 运 行 和 停止 。 


7.7 为 开发 者 构建 自助 式 工具 


在 很 多 企业 中 ,每 个 职能 部 门 构建 的 工具 都 是 为 自己 部 门 服务 的 。 例 如 ,测试 团队 开 
发 的 自动 化 测试 集 主 要 是 为 了 减少 测试 人 员 的 手工 回归 测试 工作 量 , 并 且 常 常 将 其 中 一 音 
分 核心 用 例 集 作为 提 测 的 门槛 ， 用 于 验收 开发 部 门 提交 测试 的 软件 包 质 量 。 

另外 ,还 有 下 面 这 类 场景 。 在 某 大 型 互联 网 公司 中 ,测试 部 门 开 发 的 测试 平台 只 能 在 
浏览 器 表单 中 编写 测试 用 例 ， 而 且 必 须 手 动 提交 保存 ,一 不 小 心 就 会 丢失 刚刚 写 到 一 半 的 
测试 用 例 。 这 样 差 的 易 用 性 怎么 可 能 让 习惯 于 本 地 集成 开发 环境 的 开发 人 员 喜 欢 使 用 它 
呢 ? 又 怎么 能 让 开发 人 员 喜 欢 运行 这 些 测试 呢 ? 运 维 部 门 更 是 为 了 生产 环境 的 稳定 性 ， 建 
立 起 复杂 的 审批 流程 ， 一 步 步 设 卡 。 其 负责 开发 的 生产 环境 配置 管理 中 心 非常 适合 生产 环 
并 的 管理 ， 可 能 还 非常 强大 。 但 是 ， 如 果 为 了 践 行 持续 交付 中 的 环境 一 致 性 原则 ， 让 开发 
工程 师 和 测试 工程 师 也 来 使 用 这 套 系 统 ， 那 么 ， 你 一 定 会 遇 到 很 多 困难 ， 因 为 这 样 的 系统 
并 不 是 为 日 常 调试 和 测试 环境 使 用 的 。 

世界 优秀 的 互联 网 公司 却 采 用 了 另 一 种 工具 平台 的 设计 理念 ， 即 “为 开发 工程 师 设计 
他 们 认为 好 用 的 工具 ”。 在 2006 年 ， 亚 马 逊 公司 的 首席 技术 官 Werner Vogels 对 工程 师 提 出 
“ 谁 构建 ， 谁 运营 ” (you build it you run it) 的 工作 指导 原则 。 他 说 : 

无 论 从 客户 的 角度 还 是 从 技术 的 角度 来 说 , 让 开发 工程 师承 担 一 部 分 技术 运 

营 的 责任 ， 都 有 利于 大 大 提高 服务 质量 。 传 统 方式 下 ， 开 发 人 员 把 软件 隔 “ 墙 ” 

( 指 部 门 墙 ) 扔 给 运 维 工 程 师 就 完事 儿 不 管 了 。 在 亚马逊 ， 情 况 却 不 是 这 样 的 。 

谁 构建 ， 谁 运营 。 这 不 但 让 开发 人 员 每 天 都 与 他 们 自己 的 软件 打交道 ， 而 且 也 让 

他 们 在 日 常 工 作 中 经 常 与 客户 联系 。 而 客户 反馈 环 对 改进 服务 质量 至 关 重 要 。 
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这 种 方式 要 求 创建 强大 的 工具 平台 , 能 够 很 好 地 支持 开发 工程 师 做 产品 服务 的 技术 运 
营 工 作 。 亚 马 还 也 的 确 投入 了 大 量 的 人 力 和 物力 ,创建 了 一 整套 支撑 系统 。 同 时 ， 也 要 求 
改变 工具 建设 的 思路 ， 即 所 有 的 DevOps 工 具 除 审查 性 服务 以 外 ， 都 应 该 提供 自助 式 服务 。 

例如 ， 在 Facebook 公 司 ,， 开发 人 员 可 以 通过 他 们 内 部 平台 看 到 自己 的 代码 已 经 发 布 到 
哪个 阶段 ， 有 多 少 用 户 在 使 用 (如 图 7-16 所 示 )。 此 时 ,开发 工程 师 在 不 需要 任何 人 帮助 的 
情况 下 ， 就 能 够 了 解 他 的 代码 已 经 发 布 到 哪个 阶段 了 。 
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Diff Revision Title Author 
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Your Ditts (5) f i 
Rec AN 
D5642952 rE3231885 Update test snapshot Jason 
D5642401 rE3231606 jdx() doesn'Y retun nu 有 LE tt returns undefined Jason 











图 7-16 ” Facebook 的 代码 部 署 进度 可 视 化 工具 


在 互联 网 电 商 公司 Etsy， 开 发 工程 师 可 以 查看 到 自 上 次 生产 部 署 以 后 ， 每 次 的 代码 变 
更 数量 ， 并 且 非 常 方便 地 查找 代码 差异 ， 如 图 7-17 所 示 。 











Log 


iiLCommits since last prod deploy !! 
加 Auto scroll command output? 





Add an arbitrary log message: 
PROJECT-### to link to jira and add a comment Log | 





s* [web ] | 2010-06-07 23:20:38 | PRODUCTION | jwong | Production Deploy: old 26721, new: 26722 diff 

se。 [web ] | 2010-06-07 23:18:22 | PRINCESS | jwong | Princess Deploy: old: 26721, new: 26722 diff 

se [web ] | 2010-06-07 23:16:37 | QA | jwong | Adding Jonathan and Any to about.php old: 26721, new: 26722 diff 
* [web ] | 2010-06-07 23:08:57 | PRODUCTION | ncook | Production Deploy: old 26697, new: 26721 diff 

。 [web ] | 2010-06-07 23:06:57 | PRINCESS | ncook | Princess Deploy: old: 26697, new: 26721 diff 

se [ web ] | 2010-06-07 23:06:30 | QA | ncook | transaction link fix old: 26697, new: 26721 dif 

* [web ] | 2010-06-07 21:46:25 | PRODUCTION | ncook | Production Deploy: old 26658, new: 26697 diff 

。 [web ] | 2010-06-07 21:42:29 | PRINCESS | ncook | Princess Deploy: old: 26658, new: 26697 diff 

se [web ] | 2010-06-07 21:38:00 | QA | ncook | transaction should have all images old: 26658, new: 26697 diff 


图 7-17 ”Etsy 的 代码 diff 与 生产 环境 对 比 查 找 工具 
(资料 来 源 : 《Ops Meta-Metric: The currency you pay for change》，John Allspaw，2010) 
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综 上 所 述 ， 为 了 实现 “ 谁 构建 ， 谁 运营 ”"， 企业 对 于 DevOps 工 具 的 建设 ， 应 该 坚决 从 
开发 工程 师 的 工作 场景 出 发 ， 为 其 构建 强大 的 DevOps 工 具 。 不 仅 是 生产 环境 的 运 维 工 具 ， 
而 且 是 整个 工作 流程 中 的 业务 软件 监控 工程 基础 设施 ， 它 包括 : 

e 基础 的 研发 流程 自助 平台 ， 如 各 类 运行 环境 构建、 测试 、 生 产 ) 的 自助 平台 ; 

e 数据 自助 平台 (包括 三 层 监测 数据 )， 

e 用 于 业务 快速 试 错 的 实验 测量 平台 ， 

。 针对 移动 设备 ， 建 立 用 户 触 达 平台 。 

当 我 们 以 这 种 思路 来 建设 基础 工具 平台 , 我们 的 组 织 才能 成 为 由 多 个 真正 自 驱动 、 自 
服务 的 业务 导向 型 全 功能 团队 的 学 习 型 组 织 。 


7.8 小结 


我 们 在 本 章 中 介绍 了 团队 设计 和 使 用 部 署 流 水 线 的 原则 , 以 及 企业 定制 开发 私有 部 署 
流水 线 工 具 链 的 设计 要 点 和 工具 平台 的 能 力 要 求 。 同 时 ， 还 对 四 大 基础 支撑 服务 (编译 构 
ee 自动 化 测试 服务 、 部 署 管理 服务 及 基础 环境 服务 ) 的 逻辑 组 件 进行 了 简要 介绍 。 
同时 ， 还 介绍 了 三 大 受信 源 (需求 管理 仓库 、 源 代码 仓库 和 制品 库 ) 之 间 的 关联 关系 ， 以 
nt 

本 章 中 我 们 还 列举 了 几 个 不 同 的 产品 场景 ， 以 及 相应 的 部 署 流水 线 设 计 方案 ， 供 大 家 
参考 。 要 想 让 部 署 流 水 线 发 挥 最 大 的 作用 ， 研 发 团队 需要 尽 可 能 遵守 以 下 5 条 原则 。 

(1) 任何 软件 包 的 取 用 皆 须 通过 受 控 源 , 各 角色 之 间 禁 止 通过 私有 渠道 (如 电子 邮件 、 
即时 通信 工具 等 ) 获取 。 

(2) 尽 可 能 将 一 切 流 程 自动 化 ， 并 持续 优化 执行 时 间 。 

(3) 每 次 提 是 交 都 能 够 自动 触发 部 署 流水 线 。 
(4) 尽 可 能 地 少 用 手动 触发 方式 。 
(5) 必须 执行 立即 暂停 原则 (stop the line)。 
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* 们 已 经 讨论 过 如 何 将 需求 拆 分 成 多 个 可 交付 、 可 验收 的 用 户 故 事 ， 以 及 如 何 将 

它们 安排 到 我 们 交付 迭代 的 过 程 中 。 接 下 来 ， 本 章 将 介绍 研发 团队 通过 源 代码 

仓库 ， 高 效 组 织 团队 多 人 开发 协作 的 方法 ， 即 代码 分 支 策 略 。 分 支 策略 的 选择 对 持续 交付 
的 成 本 与 效果 有 很 大 的 影响 。 


8.1 版 本 控制 系统 的 使 用 目的 


版 本 控制 系统 (Version Control System) 主要 用 于 存储 及 追踪 目录 (文件 夹 ) 和 文件 
的 修订 历史 (这 里 的 修订 操作 包括 3 类 : 新 增 、 修 改 和 删除 )y 从 而 让 你 能 够 回 济 那 些 被 纳 
入 其 管理 范围 之 内 的 任意 对 象 的 任意 一 次 修订 。 其 最 本 质 的 在 用 是 回答 “4 个 W”， 即 在 什 
么 时 间 (When)、 修改 了 什么 内 容 (What)、 是 谁 修改 的 (Who) 以 及 为 什么 要 修改 (Why)。 
其 中 最 后 一 个 “W” 是 通过 用 户 提 交代 码 变 更 时 书写 提交 注释 (Comments) 的 方式 提供 的 。 

现在 , 版 本 控制 系统 已 经 成 为 团队 合作 共同 交付 软件 过 程 中 所 用 到 的 重要 协作 管理 机 
制 ， 是 软件 公司 的 基础 设施 。 其 目标 是 支持 软件 配置 管理 活动 ， 追 踪 和 记录 多 个 版 本 的 开 
发 和 维护 活动 。 

根据 版 本 控制 系统 的 运作 方式 , 目前 市 面 上 的 主流 版 本 管理 系统 被 划分 为 集中 式 版 本 
控制 系统 和 分 布 式 版 本 控制 系统 两 种 类 型 。 


8.1.1 集中 式 版 本 控制 系统 


集中 式 版 本 控制 系统 的 出 现 , 解决 了 多 人 如 何 进 行 协同 修改 代码 的 问题 。 这 类 版 本 控 
制 系统 ， 都 有 一 个 单一 的 集中 管理 的 版 本 控制 管理 服务 器 ,保存 所 有 文件 的 历史 修订 版 本 
记录 。 团队 成 员 之 间 的 代码 交换 必须 通过 客户 端 连接 到 这 人 台 服 务 器 , 获取 自己 需要 的 文件 。 
每 个 人 如 果 想 获得 其 他 人 最 新 提交 的 修订 记录 ， 就 必须 从 集中 式 版 本 控制 系统 中 获得 。 此 
时 ， 客 户 端 并 没有 整个 集中 式 仓库 保存 的 所 有 内 容 ， 而 是 根据 用 户 的 指定 命令 ,一 次 仅 能 
获取 仓库 中 的 某 一 次 代码 文件 快照 。 集 中 式 版 本 控制 系统 示意 图 如 图 8-1 所 示 。 

当 工 程 师 修改 了 部 分 代码 , 但 尚未 完成 全 部 工作 时 ， 如果 希望 将 这 个 中 间 成 果 保 存 成 
临时 版 本 ,做 个 备份 时 ， 则 他 通常 只 有 两 种 选择 : 一 是 复制 一 份 到 另 一 个 本 地 目录 中 ; 二 





































































































8.1 版 本 控制 系统 的 使 用 目的 115 





是 直接 提交 到 中 央 人 仓库。 而 直接 提交 未 经 过 质量 检验 的 半成品 到 中 央 人 仓库， 可 能 会 影响 原 
有 的 功能 ， 妨 和 碍 团队 其 他 人 工作 。 这 种 类 型 版 本 控制 系统 的 典型 代表 是 Subversion， 简 称 
为 SVN。 











图 8-1 集中 式 版 本 管理 系统 结构 示意 图 





集中 式 版 本 控制 系统 有 两 点 劣势 。 

首先 ， 在 网 络 环境 不 佳 的 情况 下 ， 同 步 大 量 文件 时 会 经 常 失败 。2007 年 底 ，GoCD 团 
队 使 用 Subversion 作 为 版 本 管理 工具 。 软 件 产品 研发 团队 主要 在 北京 工作 ， 销 售 人 员 在 美 
国 ， 售 后 支持 人 员 在 印度 班加罗尔 ， 源 代码 仓库 所 用 的 Subversion 服 务 器 部 署 在 美国 芝 加 
哥 。 有 一 次 ,开发 人 员 从 北京 到 班加罗尔 出 差 ， 找 了 一 台新 计算 机 ， 想 在 当地 公司 办 公 室 
修改 并 提交 代码 ,但 手 上 没有 源 代码 。 于 是 ， 打 算 将 源 代码 库 从 版 本 控制 库 检 出 到 这 台新 
计算 机 上 。 然 而 源 代 码 库 稍 大 ， 印 度 办 公 室 的 网 络 不 稳定 ， 前 后 花 了 数 个 小 时 ， 也 没 能 将 
代码 从 中 央 服 务 器 拉 取 到 这 人 台 计 算 机 上 。 
其 次 ， 集 中式 版 本 服务 器 具有 单 点 故障 风险 。 假 如 Subversion 服 务 器 宕 机 一 小 时 ， 那 
么 在 这 一 小 时 内 ， 谁 都 无 法 提交 更 新 ， 也 无 法 从 服务 器 获取 文件 。 最 坏 的 情况 是 ， 如 果 服 
务 器 的 硬盘 发 生 故 障 , 并 且 没 有 做 过 备份 或 者 备份 不 及 时 , 则 还 会 有 丢失 大 量 数据 的 风险 。 
那 次 事件 以 后 ，GoCD 团 队 将 源 代 码 仓库 从 Subversion 迁 移 到 了 Mercurial， 它 是 一 款 分 布 式 
版 本 控制 系统 ， 简 称 为 Hg，Facebook 也 在 使 用 它 。 


8.1.2 分布 式 版 本 控制 系统 


分 布 式 版 本 控制 系统 与 集中 式 版 本 控制 系统 的 区 别 在 于 多 个 服务 器 共存 , 每 个 人 的 市 
点 都 是 一 个 代码 仓库 ， 所 有 的 节点 都 是 平等 的 。 在 团队 协作 过 程 中 ， 通 常会 指定 某 个 节点 
作为 团队 的 中 央 服 务 器 ， 如 图 8-2 所 示 。 

分 布 式 控制 系统 的 特点 是 : 提交 (commit) 操作 都 是 在 本 地 进行 而 无 须 经 过 服务 器 ， 
因此 提交 速度 也 更 快 。 只 有 当 需 要 向 其 他 人 或 远程 服务 器 做 文件 提交 或 同步 时 ， 才 通过 网 
络 将 其 推送 到 远程 仓库 或 从 远程 仓库 拉 取 。 因 此 ， 即 使 在 没有 网 络 环境 的 情况 下 ， 你 也 可 
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以 非常 愉快 地 频 葵 提交 更 新 。 当 有 了 网 络 环境 的 时 候 ， 再 推送 到 远程 的 团队 代码 仓库 。 目 
前 主流 的 分 布 式 版 本 控制 系统 是 Git。 











| 





图 8-2 ”分 布 式 版 本 控制 系统 的 结构 示意 


前 面 提 到 GoCD 团 队 工程 师 在 印度 遇 到 的 情况 ，、 如 有 果 使 用 分 布 式 版 本 管理 仓库 ， 即 使 
网 络 不 稳定 ， 也 可 以 比较 方便 地 完成 代码 拉 取 操作 ， 如 图 8-3 所 示 。 


























图 8-3 ”经 本 地 网 络 克隆 他 人 代码 库 获 取代 码 
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(2 
(3 
(4 
(5 


8.1.3 


) 
尔 办 公 室 )。 

) 

) 

) 

) 


Bob 通 过 班加罗尔 办 公 网 络 克隆 (clone) 一 份 Sara 的 代码 仓库 (Sara 也 在 班 加 罗 








Bob 从 芝加哥 的 中 央 仓 库 中 拉 取 (pull) 与 本 地 仓库 有 差异 的 代码 。 

Bob 修 改 代码 文件 ， 并 提交 (commit) 到 本 地 仓库 ， 产 生 一 个 新 的 文件 版 本 。 
Bob 将 这 个 新 的 版 本 推送 (push) 至 中 央 仓 库 。 

Sara 即 可 从 中 央 仓 库 拉 取 (pull) 所 有 的 差异 代码 。 


版 本 控制 系统 中 的 基本 概念 


版 本 控制 系统 要 解决 的 核心 问题 是 多 人 协作 过 程 中 的 文件 版 本 管理 问题 。 目 前 所 有 的 


版 本 控制 
因为 有 多 种 版 本 控制 系统 ， 所 以 有 必要 对 这 些 概 念 进行 统一 定义 ， 以 方便 后 续 的 讨论 。 








I 系统 中 都 有 儿 个 相似 的 概念 , 用 于 协调 多 人 协作 。 在 具体 讨论 多 人 协作 模式 之 前 ， 


代码 仓库 (codebase) 是 指 一 个 包含 一 组 文件 所 有 历史 修改 信息 的 逻辑 单位 , 通常 
用 于 保存 有 关 一 个 软件 产品 或 某 一 组 件 的 所 有 文件 信息 记录 。 

分 支 (branch) 是 指 对 选 定 的 代码 基线 创建 一 个 副本 。 人 们 可 以 对 这 个 副本 中 的 文 
件 进行 操作 ， 而 这 些 操作 与 原 有 代码 基线 的 文件 操作 是 互 不 影响 的 。 

主干 (trunk/master) 是 一 个 具有 特殊 意义 的 分 支 (branch) ， 通 常 在 创建 代码 仓库 
时 即 由 版 本 控制 系统 默认 创建 ， 每 个 代码 仓库 有 且 仅 有 一 个 这 样 的 分 支 。 其 特殊 
意义 在 于 其 与 软件 的 开发 活动 和 发 布 方式 紧密 关联 ， 例 如 ， 在 SVN 中 以 “trunk” 
命名 的 分 支 和 Git 中 以 “master” 命 名 的 分 支 都 是 主干 分 支 ， 我 们 将 在 分 支 模式 进 
一 步 讨论 它们 的 特殊 意义 。 

版 本 号 (revision) 对 应 在 某 个 分 支 (branch) 上 的 一 次 提交 操作 ， 是 系统 产生 的 
一 个 编号 。 通过 这 个 编号 , 你 可 以 获取 该 次 提交 操作 时 点 的 所 有 文件 镜像 。 在 SVN 
中 ， 它 叫 作 revision， 是 一 个 连续 变化 的 正 整数 。 而 在 Git 中 ， 它 是 一 个 40 位 的 散 列 
值 , 类 似 于 “734713bc047d87b……… 6Sae793478c50d3 ”这 样 一 段 字 母 与 数字 的 组 合 。 
为 了 方便 使 用 ，Git 可 以 使 用 该 散 列 值 的 前 几 个 字符 来 识别 某 次 提交 ， 只 要 你 提供 
的 那 部 分 SHA-1 不 短 于 4 个 字符 ， 并 且 没 有 歧义 即 可 。 

标签 (tag) 是 某 个 分 支 上 某 个 具体 版 本 号 的 一 个 别名 ， 以 方便 记忆 与 查找 。 你 可 
以 通过 版 本 控制 工具 自身 提供 的 命令 来 创建 这 个 别名 。 

头 (head) 是 指 某 个 分 支 上 的 最 新 一 次 提交 对 应 的 版 本 号 。 

合 入 (merge) 是 指 将 一 个 分 支 上 的 所 有 内 容 与 某 个 目标 分 支 上 的 所 有 内 容 进 行 
并 ， 并 在 该 目标 分 支 上 创建 一 个 新 版 本 号 。 

冲突 (conflict) 是 指 在 合 入 操作 时 ， 两 个 分 支 上 的 同一 个 文件 在 相同 位 置 上 出 现 
不 一 致 的 内 容 。 通 常 需要 人 工 介 入 ， 确 认 如 何 修改 后 ， 方 可 合 和 人 目标 分 支 。 
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依据 上 面 的 定义 ， 通 过 下 面 的 字 串 记录 方式 可 以 唯一 确定 某 个 代码 镜像 
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{代码 仓库 名 } : {分 支 名 } : {版 本 号 } 或 者 {代码 仓库 名 } : {分 支 名 } : {标签 } 


8.2 常见 分 支 开发 模式 


目前 基于 版 本 控制 系统 的 开发 模型 , 根据 新 功能 开发 以 及 版 本 发 布 所 用 的 分 支 进行 分 
类 ， 主 要 有 3 种 ， 它 们 分 别 是 ; 

(1) 主干 开发 ， 主 干 发 布 (Trunk-based Development & Release ) ; 

(2) 主干 开发 ， 分 支 发布 (Trunk-based Development & Branch-based Release ) ; 

(3) 分 支 开 发 ， 主 干 发 布 (Branch-based Development & Trunk-based Release ) 。 

下 面 我 们 分 别 介 绍 一 下 它们 各 自 的 特点 。 
8.2.1 主干 开发 ， 主 干 发 布 

顾 名 思 议 ,“ 主 干 开发 ， 主 干 发 布 ” 是 指 工程 师 向 主干 上 提交 代码 (或 者 每 个 分 支 的 
生存 周期 很 短 ， 如 数 小 时 ， 或 少 于 1 天 )， 并 用 主干 代码 进行 软件 交付 (如 图 8-4 所 示 )。 也 
就 是 说 ， 所 有 新 特性 的 开发 ， 代 码 均 提 交 到 主干 (trunk) 上 ; 当 需 要 发 布 新 功能 时 ， 直 接 
将 主干 上 的 代码 部 署 到 生产 环境 上 。 











于 发布 vy vy 


可 发 布 状 态 





(3) 低频 交付 


不 可 发 布 状态 
QO 〇 ”新 功能 开发 a 下 了 了 了 了 了 了 > 


@ 缺陷 修复 
Cb) 高 频 交付 

图 8-4 “主干 开发 ， 主 干 发 布 ” 模 式 

根据 交付 频率 不 同 ， 可 以 分 为 低频 交付 和 高 频 交付 两 类 。 低 频 交 付 类 型 常见 于 一 些 周 
期 比较 长 的 大 型 软件 开发 项 目 ， 也 是 一 种 最 古老 的 软件 开发 模式 ， 当 时 的 IT 行业 是 以 数 年 
或 数 月 为 一 个 交付 周期 。 在 低频 工作 模式 下 ， 其 主干 代码 总 是 长 时 间 处 于 不 可 用 状态 ， 只 
有 在 项 目 内 所 有 功能 的 代码 开发 完成 后 ， 才 开始 进行 软件 联 调和 集成 测试 工作 。 在 开发 期 
间 ， 版 本 控制 系统 的 作用 仅仅 是 确保 代码 不 丢失 ， 是 纯粹 的 代码 备份 仓库 。 

高 频 交付 子 类 型 是 指 代码 库 中 的 代码 发 布 频率 较 高 , 通常 每 天 都 会 发 布 一 次 ,其 至 多 
次 。 高 频 交付 子 类 型 常见 于 具有 比较 完备 的 交付 基础 设施 (自动 化 配置 构建 、 自 动 化 测试 、 
自动 化 运 维 、 自 动 化 监控 与 报警 等 ) 的 互联 网 产品 团队 ,通常 也 有 快速 缺陷 修复 能 力 ,， 尤 
其 适用 于 后 台 服 务 端 产品 形态 (如 Web 网 站 或 SaaS 软 件 的 后 台 服 务 )。 

这 种 模式 的 优点 在 于 分 支 方式 简单 ， 因 此 分 支管 理工 作 量 较 少 (如 代码 合并 成 本 )， 
但 也 存在 弱点 。 例 如 ， 针 对 低频 交付 模式 ， 其 项 目 后 期 的 缺陷 修复 阶段 ， 并 不 是 团队 所 有 
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人 都 需要 做 缺陷 修复 ， 会 有 一 定 的 资源 浪费 。 针 对 这 种 情况 ， 很 多 团队 会 采用 后 续 介 绍 的 
“主干 开发 ， 分 支 发 布 ”模式 ， 下 面 会 详细 介绍 。 

针对 高 频 交 付 模式 ， 由 于 多 人 向 主干 上 频 繁 提交 代码 ， 其 代码 变动 非常 快 。 假 如 某 个 
开发 人 员 拉 出 一 个 私有 开发 分 支 , 并 在 该 开发 分 支 上 进行 开发 , 开发 完成 后 再 合并 回 主干 。 
此 时 ,他 只 有 两 种 工作 方式 。 一 是 每 天 从 主干 上 更 新 代码 到 他 自己 的 分 支 上 。 此 时 该 开发 
人 员 很 可 能 每 天 需要 一 两 个 小 时 将 主干 上 的 代码 与 自己 分 支 上 的 代码 进行 合并 。 二 是 不 做 
每 日 更 新 ， 而 是 一 段 时 间 后 (例如 在 分 支 上 开发 完成 特性 ) 之 后 ， 再 向 主干 合并 。 此 时 ， 
很 可 能 由 于 主干 上 的 代码 变化 太 大 ， 导 致 自己 这 个 分 支 上 的 代码 已 经 无 法 再 合并 回去 了 。 











无 法 完成 的 “合并 任务 ” 

2011 年 ， 百 姓 网 (一 个 生活 分 类 服务 网 站 ) 的 研发 团队 只 有 12 名 工程 师 。 他 们 使 
用 高 频 交 付 模式 ,每 天 早上 7 点 做 一 次 生产 环境 发 布 。 为 了 对 菜 个 重要 模块 进行 重大 重 
构 ， 其 技术 负责 人 曾经 创建 了 一 个 专 有 分 支 。 然 而 ， 一 周 以 后 ， 他 不 得 不 宣布 放弃 该 
分 支 的 所 有 代码 ， 因 为 其 他 工程 师 在 主干 上 已 经 做 了 太 多 的 改动 ， 专 有 分 支 已 经 无 法 
合并 回 主干 。 

“未 开发 完成 的 功能 代码 不 能 带 入 将 要 发 布 的 版 本 里 ” 曾 被 认为 是 一 种 最 佳 软 件 质量 
管理 实践 。 然 而 ， 在 这 种 高 频 交 付 模 式 下 ， 很 难 再 遵守 这 一 实践 。 相 反 ， 应 该 允许 提交 未 
完成 功能 的 代码 ， 前提 是 不 影响 用 户 的 正常 使 用 和 发 布 。 为 了 使 未 开发 完成 的 功能 不 影响 
发 布 质量 ， 可 以 使 用 一 些 特殊 技术 管理 手段 (如 开关 技术 或 抽象 分 支 方 法 等 ) 来 处 理 这 类 
问题 ， 当 然 ， 这 些 手段 也 会 产生 一 定 的 管理 开销 。 详 细 方 法 参见 第 12 章 。 与 此 同时 ， 高 频 
交付 模式 也 要 求 质量 保证 活动 能 够 做 到 既 快 速 又 全 面 。 


8.2.2 ”主干 开发 ， 分 支 发 布 
“主干 开发 ， 分 支 发 布 ”这 种 开发 模式 如 图 8-5 所 示 。 
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图 8-5 “主干 开发 ， 分 支 发 布 ”模式 
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这 种 开发 模式 是 指 : 
e 开发 人 员 将 写 好 的 代码 提交 到 主干 ， 
e 当 新 版 本 的 功能 全 部 开发 完成 或 者 已 经 接近 版 本 发 布 时 间 点 的 时 候 ， 从 主干 上 拉 
出 一 个 新 的 分 支 ， 
。 在 这 个 新 的 分 支 上 进行 集成 测试 ， 并 修复 缺陷 ， 进 行 版 本 质量 打磨 。 当 质量 达 
后 ， 再 对 外 发 布 该 版 本 。 
其 特点 如 下 : 
。 主干 代码 提交 活动 频繁 ， 对 保障 主干 代码 质量 有 较 大 的 挑战 ， 
e 分 支 只 修复 缺陷 ， 不 增加 新 功能 ， 
e 新 版 本 发 布 后 ， 如 果 发 现 严重 缺陷 ， 而 且 必 须 立 即 修复 的 话 ， 只 要 在 该 版 本 所 属 
的 分 支 上 修复 后 ， 再 次 发 布 补丁 版 本 ， 然 后 将 分 支 上 的 修改 合并 回 主干 即 可 。 也 
可 以 在 主干 上 修复 缺陷 ， 然 后 将 针对 该 缺陷 的 修复 代码 挑 出 来 (cherry-pick) 合并 
到 该 缺陷 所 在 的 分 支 上 。Facebook 的 移动 端 产品 开发 流程 就 使 用 后 面 这 种 方式 。 
通常 , 发布 分 支 的 生命 周期 不 应 该 持续 时 间 过 长 ,一 段 时 间 后 应 该 终止 该 分 支 上 的 任 
何 操作 活动 ， 例 如 ， 图 8-5 中 V1.01 发 布点 之 后 ，V1:0 分 支 应 该 结束 。 
在 “主干 开发 、 分 支 发 布 ” 模 式 下 ， 从 拉 出 发 布 分 支 开 始 ， 到 分 支 代码 达到 可 交付 状 
态 的 时 间 周 期 可 以 作为 评估 主干 代码 质量 的 指示 器 , 我 们 称 之 为 “质量 打磨 周期 (Branch 
Stabilization Time)”。 打 磨 周 期 越 短 ， 说 明 主干 代码 质量 越 好 。< 当 质量 打磨 周期 极 短 时 ， 
就 可 以 转换 到 高 频 的 “主干 开发 ， 主 干 发 布 ” 模 式 。 当 然 ， 做 到 这 一 点 并 不 容易 ， 需 要 结 
合 本 书 其 他 部 分 所 描述 的 原则 、 方 法 与 实践 ， 方 能 游 丸 有余。 
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该 模式 的 优势 在 于 : 
。 与 将 要 发 布 的 新 功能 无 关 的 人 员 可 以 持续 工作 在 开发 主干 上 ， 不 受 版 本 发 布 的 
影响 ， 





e 新 发 布 的 版 本 出 现 缺陷 后 ， 可 以 直接 在 其 自己 的 版 本 发 布 分 支 上 进行 修复 ， 简 单 便 
捷 。 即 使 当前 开发 主干 上 的 代码 已 经 发 生 了 较 大 的 变化 ， 该 分 支 也 不 会 受到 影响 。 

其 不 足 在 于 : 

。 主干 上 的 代码 通常 只 能 针对 下 一 个 新 发 布 版 本 的 功能 开发 。 只 要 新 发 布 版 本 的 任 
何 功 能 在 主干 上 还 没有 开发 完成 ， 就 不 能 创建 版 本 发 布 分 支 ， 否 则 很 有 可 能 影响 
下 一 个 发 布 的 开发 计划 , 开源 项 目 在 发 布 时 间 点 以 及 特性 功能 方面 的 压力 小 一 些 ， 
因此 常常 采用 这 种 分 支 方式 ， 

e 使 用 这 种 开发 模式 ， 对 发 布 分 支 的 数量 不 加 约束 ， 并 且 分 支 周 期 较 长 ， 很 容易 出 
现 “ 分 支 地 狱 ”倾向 ， 这 种 倾向 常见 于 “系列 化 产品 徐 + 个 性 化 定制 ”的 项 目 ， 例 
如 某 硬件 设备 的 软件 产品 研发 的 分 支 模式 ， 如 图 8-6 所 示 。 
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Az3.0 Az3.01 
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Axl.0 Ax1.01 
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四 发布 
me 发 布 状态 
不 可 发 布 状态 
一 一 一 代码 在 分 支 间 的 移植 


Bl1.0 





图 8-6 ”分支 地 狱 


该 硬件 设备 最 初 只 有 一 种 类 型 ， 其 类 别 定义 为 A， 型 号 是 x， 对 应 软件 的 发 布 版 本 为 
Ax1.0。 发 布 以 后 ， 客 户 提 出 了 同类 别 不 同型 号 的 紧急 需求 ， 公 司 为 了 能 够 快速 响应 客户 
需求 ， 从 Ax1.0 的 产品 分 支 上 又 拉 出 一 个 产品 分 支 ， 名 为 Ay 分 支 ， 其 发 布 版 本 为 Ay2.0。 然 
后 又 在 Ay 的 基础 上 开发 了 一 个 增强 版 Az， 对 应 的 分 支 及 时 间 点 如 图 8-6 所 示 。 随 后 在 Ax1.0 
上 发 现 了 一 个 严重 缺陷 ， 需 要 增发 A1.01 补 丁 版 本 。 该 缺陷 在 Ay 分 支 和 Az 分 支 上 也 同时 存 
在 。 因 此 就 要 将 修复 缺陷 的 代码 移植 到 主干 及 Ay 和 Az 两 个 分 支 。 

该 公司 以 这 种 管理 模式 支持 了 更 多 类 别 和 型 号 的 产品 。 如 图 8-6 中 ， 公 司 开 发 了 硬件 
产品 B， 而 其 软件 版 本 是 从 主干 分 支 上 拉 出 ， 并 先后 发 布 了 B1.0 和 B1.01。 客 户 需要 在 B 类 
型 上 也 具有 Ay2 和 Az3 上 的 部 分 新 功能 特性 ， 于 是 ， 公 司 决定 从 Ay2.01 和 Az3.0 的 分 支 上 移 
植 该 新 功能 的 代码 到 B 分 支 上 。 

随 着 硬件 类 别 和 型 号 的 不 断 衍 生 ， 研 发 团队 效率 越 来 越 差 。 如 图 8-6 中 的 虚线 处 所 示 ， 
团队 终 将 疲 于 在 分 支 间 移植 代码 和 测试 。 

这 与 《大 规模 敏捷 开发 实践 ，HP LaserJet 产 品 线 敏捷 转型 的 成 功 经 验 》 一 书 中 描述 的 
HP 激光 打印 机 固件 团队 在 2008 年 的 状态 相似 。 该 团队 仅 有 5% 的 资源 用 于 新 功能 的 开发 ， 
而 各 分 支 间 移 植 代码 会 占用 团队 25% 的 时 间 ， 如 图 8-7 所 示 。 


8.2.3 分支 开发 ， 主 干 发 布 
“分 支 开发 ， 主 干 发 布 ” 模 式 是 一 种 最 为 广泛 应 用 的 工作 方式 ， 如 图 8-8 所 示 。 
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图 8-7 HP 激光 打印 机 固件 团队 2008 年 的 研发 资源 分 布 
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图 8-8 “分 支 开发 ， 主 干 发 布 ” 模 式 

这 种 模式 是 指 : 

e 团队 从 主干 上 拉 出 分 支 ， 并 在 分 支 上 开发 软件 新 功能 或 修复 缺陷 

e。 当 某 个 分 支 (或 多 个 分 支 ) 上 的 功能 开发 完成 后 要 对 外 发 布 版 本 时 ， 才 合 入 主干 ; 

e 通常 在 主干 上 进行 缺陷 修复 ， 质 量 达标 后 ， 再 将 主干 上 的 代码 打包 发 布 。 

这 种 模式 的 优势 在 于 : 

e 在 分 支 合并 之 前 ， 每 个 分 支 之 间 的 开发 活动 互相 不 受 影响 ; 

e 团队 可 以 自由 选择 发 布 哪个 分 支 上 的 特性 ; 

e 如 果 新 版 本 出 现 缺陷 ， 可 以 直接 在 主干 上 进行 修复 或 者 使 用 hotfix 分 支 修复 ， 简 单 

便捷 ， 无 须 考虑 其 他 分 支 。 

它 的 优势 也 会 导致 不 良 后 果 ， 即 为 了 分 支 之 间 尽 量 少 受 影响 , 开发 人 员 通 常会 减少 向 
主干 合并 代码 的 频率 ， 从 而 推迟 了 发 现 各 分 支 中 代码 冲突 的 时 间 ， 不 利于 及 时 进行 代码 重 
构 ， 如 图 8-9 所 示 。 

该 主干 上 的 代码 中 原 有 一 个 方法 签名 为 handleY(int b)。Alice 和 Bob 各 自 领取 了 一 个 新 
功能 的 开发 任务 ， 并 创建 了 对 应 的 一 个 分 支 A 和 B， 而 且 ， 在 新 功能 开发 完成 之 前 ， 两 人 
都 没有 向 主干 合并 代码 。 为 了 完成 自己 的 新 功能 ，Alice 对 handleY 方 法 进行 了 修改 ， 将 其 
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签名 变更 为 handleY(int[] b，boolean c)。 同 时 ，Bob 在 自己 的 分 支 上 也 修改 了 handleY(int b) 
的 内 部 实现 。 主 干 上 发 生 了 两 次 hotfix， 两 人 都 将 主干 的 修改 合 入 了 自己 的 分 支 上 。 在 这 
之 后 ，Bob 又 从 handleY(intb) 中 抽取 了 一 个 方法 ， 签 名 为 findX(int[] a)。 此 时 Alice 开 发 完成 
了 自己 的 新 功能 ， 将 代码 (从 al 到 a4) 合 入 主干 。 当 Bob 打 算 提 交代 码 到 主干 时 ， 他 需要 
将 Alice 的 4 次 代码 变更 与 自己 的 5 次 变更 合并 在 一 起 。 由 于 Alice 修 改 较 大 , 这 个 合并 很 可 能 
成 了 非常 大 的 包容 。Bob 发 现 ，Alice 不 但 修改 了 很 多 文件 ， 而 且 对 方法 handleY0 进 行 了 较 
大 的 重 构 。 然 而 ， 这 些 还 只 是 文本 上 的 冲突 ， 比 较 容易 发 现 和 修正 。 风 险 更 大 的 则 是 语义 
上 的 冲突 ， 即 程序 运行 时 的 逻辑 冲突 。 这 类 情况 的 发 生 会 令 团 队 成 员 进 行 代码 重 构 的 意愿 
大 大 下 降 ， 从 而 令 代 码 的 可 维护 性 越 来 越 糟糕 。 


handleY(int[] b, boolean c) 








handleY(int b) handleY(int b) 
findX(int[] a) 


图 8-9 不 频繁 的 集成 导致 的 巨型 代码 合并 
如 果 分 支 过 多 ， 那 么 衍生 出 来 的 问题 是 : 当 某 个 分 支 的 生命 周期 ( 即 从 主干 拉 出 分 支 








那 一 时 刻 至 将 其 再 次 合 入 主干 这 段 时 间 周 期 ) 过 长 ， 代 码 合并 及 验收 成 本 会 快速 增加 。 成 
本 增加 的 数量 与 其 生命 周期 中 合 入 主干 的 分 支 数 量 成 正比 。 

若 想 成 功 使 用 这 种 模式 ， 其 关键 点 在 于 : 

。 让 主干 尽 可 能 一 直 保 持 在 可 发 布 状态 ; 

。 每 个 分 支 的 生命 周期 应 该 尽 可 能 短 ; 

。 主干 代码 尽早 与 分 支 同 步 ， 

e 一 切 以 主干 代码 为 准 ， 尽 可 能 不 要 在 各 特性 分 支 之 间 合 并 代码 。 

另外 ， 根 据 分 支 的 存在 周期 和 目的 ,“ 分 支 开 发 ， 主 干 发 布 ”模式 还 可 以 进一步 分 为 
两 种 子 类 型 ， 它 们 分 别 是 特性 分 支 模式 和 团队 分 支 模式 。 

1. 特性 分 支 模式 

在 开发 过 程 中 ,人 允许 多 个 开发 分 支 同时 存在 ， 且 每 个 分 支 对 应 一 个 功能 特性 的 开发 工 
作 。 当 该 特性 开发 完成 后 ， 立 即 合 和 主干， 其 他 尚未 合 入 主干 的 特性 分 支 需要 从 主干 拉 取 
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主干 代码 , 与 自己 分 支 上 的 代码 进行 合并 后 , 才能 再 合 回 主 干 。 这 种 模式 为 特性 分 支 模式 ， 
如 图 8-10 所 示 。 
特性 4 得。 发布 
me 发 布 状态 
不 可 发 布 状态 


特性 3 


了 了 


主干 gt 


特性 1 
特性 2 


图 8-10 ”特性 分 支 模式 





该 模式 的 目的 是 : 让 团队 更 容易 在 “特性 ”这 个 层次 上 并 行 工 作 ， 同 时 保持 主干 的 
稳定 可 发 布 状态 。 其 优势 在 于 每 次 发 布 的 内 容 调整 起 来 比较 容易 。 假 如 某 个 新 功能 或 者 
缺陷 在 版 本 发 布 时 间 点 之 前 无 法 完成 ， 则 不 必 合 入 主干 中 ， 也 不 会 影响 其 他 功能 的 发 布 
时 间 点 。 

但 这 种 模式 也 有 不 足 : 如 果 特 性 分 支 过 多 ,会 带 来 比较 多 的 合并 成 本 。 例 如 ， 每 当 某 
个 特性 分 支 开发 完成 打算 合 入 主干 时 ， 都 需要 与 主干 的 代码 合并 ， 并 进行 质量 验证 。 一 旦 
主干 代码 的 质量 验证 通过 , 其 他 分 支 此 时 都 应 该 从 主干 主 拉 取 最 近 的 通过 质量 验证 的 新 代 
码 。 否 则 ， 如 果 在 特性 开发 完成 后 再 与 主干 合并 ， 那 从 这 种 一 次 性 合并 会 带 来 较 大 的 工作 
量 和 质量 验证 工作 。 如 图 8-10 所 示 ， 特 性 2 分 支 需要 合并 特性 1、3 和 4 的 代码 。 

假如 有 多 个 特性 同时 开发 完成 ， 怎 么 办 ? 下 面 是 两 种 极端 的 做 法 。 

(1) 所 有 已 完成 的 特性 分 支 一 同 向 主干 合并 , 然后 再 共同 设法 让 主干 代码 达到 可 交付 
状态 。 这 种 方式 通常 会 被 特性 团队 排斥 。 因 为 共同 合并 后 ， 多 方 代码 交织 在 一 起 ， 出 现 的 
缺陷 可 能 很 难 快速 定位 和 快速 修复 。 

(2) 所 有 已 完成 的 特性 分 支 排 成 队列 ， 以 顺序 方式 合 入 主干 。 每 个 特性 分 支 向 主干 合 
入 代码 后 ， 必 须 使 主干 上 的 代码 达到 可 交付 状态 后 ， 下 一 个 特性 分 支 才 可 以 合 人 。 这 种 方 
式 通常 是 特性 分 支 的 常见 做 法 ， 也 是 特性 分 支 的 优势 所 在 。 但 所 带 来 的 问题 是 ， 多 个 特性 
分 支 按 排队 顺序 进行 合并 ， 会 导致 排 在 队 尾 的 特性 分 支 等 待 较 长 的 时 间 。 

如 果 想 让 特性 分 支 方式 更 好 地 工作 ， 需 要 做 好 下 面 的 管理 。 

(1) 每 个 特性 分 支 的 生命 周期 都 应 该 很 短 ， 分支 上 的 开发 和 测试 工作 尽量 在 3 天 内 完 
成 。 这 要 求 尽 可 能 将 “特性 ” 拆 分 成 小 需求 。 关 于 需求 拆 分 的 方法 ， 参 见 第 6 章 。 

(2) 开发 人 员 每 天 从 主干 上 拉 取 最 新 的 可 交付 代码 ， 与 自己 的 分 支 合并 。 

(3) 不 要 从 其 他 特性 分 支 上 拉 取 代码 。 
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某 互 联网 公司 的 特性 分 支 与 排队 上 线 


某 互 联网 公司 在 2011 年 主要 采用 “分 支 开 发 ， 主 干 发 布 ” 的 代码 分 支 策略 ,如 图 8-11 
所 示 。 主线 为 发 布 主 干 ， 而 尚 在 开发 或 测试 的 特性 代码 都 在 各 自 的 项 目 分 支 上 。 当 项 目 
在 配置 管 a Se 
版 本 处 拉 出 特性 项 目 分 支 ， 进 行 功能 开发 工作 。 当 开发 完成 后 ， 进 入 联 调 自 测 阶段 。 
阶段 由 开发 人 员 自行 负责 。 完成 联 调 后 ， 即 可 在 配置 管理 平台 上 让; 人 


将 A 分 支 ”项 目 A 将 B 分 支 
合并 回 主干 上 线 点 合并 回 主 干 








项 目 A 
| 主干 代码 合并 到 特性 分 支 






创建 特性 B 分 支 








山 联 调 点 提 测 点 
() Cy CCCOCOC ) 

















项 目 B O 
， 开发 人 员 ! 开发 人 员 。'， 开发 人 员 ! 
， [a 5 各 ，[ 个 复 滞 “]; 
| 编码 | | ! 测试 人 员 1! 
1 自 测 ! ! | 多 轮 测试 |， 





图 8-11 某 互联 网 公司 的 分 支 发 布 策略 示意 图 


申请 提 测 时 , 平台 会 自动 生成 一 个 4 位 版 本 号 (如 1.2.1.1 ), 并 自动 通知 测试 负责 人 
测试 负责 人 马上 安排 测试 人 员 进 行 测试 。 发 现 缺 陷 后 ,测试 人 员 通 知 开发 人 员 进行 修改 . 
开发 人 员 修 改 完 成 后 ， 再 次 申请 提 测 ， 生 成 一 个 新 的 4 位 版 本 (如 1.2.1.2 )。 

重复 这 个 过 程 ， 直 到 质量 达标 ， 就 进入 等 待 合 入 的 队列 。 如 果 等 待 队列 中 没有 其 他 
项 目 ， 那 么 开发 人 员 即 可 将 代码 合 入 主线 ， 再 次 进行 测试 ， 质 量 达标 后 即 可 整理 上 线 部 
署 文档 ， 编 写 上 线 操作 步 又， 上 传 到 运 维 平 台 ， 交 由 业务 运 维 人 员 进 行 操作 。 

根据 运 维 部 门 的 规定 , 每 周 只 有 两 个 工作 日 可 以 进行 上 线 操作 。 并 且 每 次 只 允许 一 
个 项 目 上 线 。 因 此 ， 曾 出 现 过 14 个 项 目 分 支 排队 等 待 上 线 的 情况 。 这 14 个 已 经 开发 完成 
的 特性 分 支 最 快 也 需要 7 周 的 时 间 才 能 合并 上 线 完成 。 还 要 祈祷 每 个 分 支 的 代码 质量 都 

非常 好 ， 每 个 分 支 上 线 时 都 不 出 现任 何 严 重 问 题 ， 不 需要 回 滚 和 修改 。 


2. 团队 分 支 模式 

团队 分 支 可 以 看 作 是 特性 分 支 的 一 种 特殊 情况 。 也 就 是 说 , 一 组 人 一 起 在 同一 个 分 支 
上 进行 开发 工作 ,而 且 该 分 支 上 通常 包括 一 组 相近 或 相关 的 特性 集合 的 开发 。 由 于 是 一 组 
特性 集合 的 开发 ， 因 此 其 分 支 存 续 时 间 比 特性 分 支 的 存续 时 间 长 。 
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这 种 分 支 模式 通常 出 现 于 规模 较 大 的 团队 〈40 人 以 上 ) 共同 开发 同一 款 产 品 ， 团 队 被 
分 成 多 个 组 ,每 组 开发 不 同 的 系统 组 件 。 只 有 当 一 系列 功能 特性 开发 完成 后 ， 才 对 外 发 布 
新 的 软件 版 本 ， 很 容易 成 为 典型 的 瀑布 开发 流程 ， 如 图 8-12 所 示 。 








团队 1 
了 
团队 2 于 发 布 
ee 发布 状 态 
团队 3 不 可 发 布 状态 





图 8-12 ”团队 分 支 模式 


团队 分 支 模式 在 通信 公司 的 产品 研发 或 大 型 客户 端 软件 产品 研发 中 比较 常见 , 例如 第 
14 章 的 案例 中 ， 团 队 研发 管理 模式 改进 之 前 ， 就 使 用 这 种 开发 模式 .。 成 功 应 用 这 种 模式 的 
关键 在 于 : 

(1) 每 个 团队 尽早 向 主干 合 入 高 质量 的 代码 ， 即 使 不 马上 发 布 ， 

(2) 向 主干 合 入 代码 后 ， 尽 快 使 其 达到 可 交付 状态 ， 

(3) 其 他 团队 尽早 从 主干 拉 取 可 交付 状态 的 代码 志 与 自己 分 支 上 的 代码 合并 。 


8.3 分支 模式 的 演化 


基于 前 面 3 种 基本 分 支 模式 ， 在 实际 工作 中 ， 根 据 不 同 的 软件 项 目 特点 ， 以 及 不 同 团 
队 各 自 工作 习惯 及 软件 演进 历史 ,还 衍生 了 很 多 其 他 形式 的 分 支 模式 ， 例 如 常用 于 客户 端 
套装 软件 的 三 驾 马 车 分 支 模式 ， 以 及 常见 的 Gitflow 分 支 模式 、GitHubFlow 分 支 模式 等 。 
8.3.1 三 驾 马车 分 支 模式 

三 轰 马车 分 支 模式 是 指 软件 开发 团队 仅 维护 3 个 分 支 ， 分 别 是 开发 分 支 、 预 发 布 分 支 
和 发 布 分 支 ， 如 图 8-13 所 示 。 在 2010 年 时 ，Chrome 浏 览 器 就 使 用 这 种 分 支 开发 模式 。 









































了 有 
预 发 布 分 支 co 一 0 一 co-o-o-ooa 下 责 发 布 
一 一 一， 可 发 布 状态 
开发 分 支 不 可 发 布 状态 








到 8-13 ”三 轰 马车 分 支 模式 


开发 分 支 就 是 所 有 开发 人 员 提交 代码 的 目标 分 支 。 当 开发 分 支 上 有 足够 多 的 新 功能 
(或 者 即将 接近 既定 的 发 布 日 ) 时 ， 将 该 分 支 中 准备 发 布 的 那些 功能 分 捡 到 (Cherry Pick) 
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预 发 布 分 支 上 。 在 这 个 预 发 布 分 支 上 只 做 缺陷 修复 、 文 档 生 成 及 与 发 布 相关 的 工作 ,不 做 
新 功能 开发 。 当 团队 认为 该 分 支 代 码 达 到 Alpha 版 本 发 布 质 量 时 ， 会 发 布 一 个 Alpha 版 本 。 
Alpha 版 本 只 给 极 少 用 户 进行 体验 。 然 后 再 进一步 发 布 Beta 版 本 , 它 主 要 是 为 了 让 尝鲜 用 户 
进行 版 本 体验 ， 以 便 尽早 发 现存 在 的 质量 问题 ， 及 时 修正 。 当 预 发 布 分 支 上 发 布 的 Beta 版 
本 代码 基本 稳定 后 ,即将 这 部 分 代码 合 入 发 布 分 支 ,并 发 布 一 个 RC 版 本 (Release Candidate) 
给 一 部 分 用 户 。 如 果 RC 版 本 质量 稳定 ， 即 可 作为 正式 版 本 发 布 。 


8.3.2 ”Gitflow 分 支 模式 


Gitflow 分 支 模式 是 目前 很 多 企业 所 应 用 的 分 支 模式 ， 如 图 8-14 所 示 。 

(1) Master 分 支 是 正式 版 本 的 发 布 分 支 。 

(2) Release 分 支 是 用 于 质量 打磨 的 预 发 布 分 支 。 如 果 Release 分 支 的 质量 达标 , 就 可 以 
将 其 合 和 人 Master 分 支 ， 同 时 也 需要 将 代码 合 和 人 Development 分 支 。 

(3) Development 分 支 是 对 新 功能 进行 集成 的 分 支 。 

(4) Feature 分 支 是 为 了 开发 某 一 功能 特性 ， 开 发 人 员 从 Development 分 支 上 拉 出 的 分 
支 。 当 特性 开发 完成 后 ， 合 和 人 Development 分 支 。 

(5) 如 果 已 经 发 布 的 版 本 (如 V0.1) 出 现 了 严重 的 缺陷 ， 从 Master 分 支 上 V0.1 版 本 标 
签 处 拉 出 Hotfix 分 支 ， 在 这 个 分 支 上 修复 缺陷 ， 验 证 后 再 次 合 入 Master 分 支 ， 并 发 布 新 的 
补丁 版 本 V0.2。 与 此 同时 ， 由 于 Development 分 支 上 也 有 同样 的 缺陷 存在 ， 因 此 开发 人 员 
还 要 将 Hotfix 分 支 的 代码 移植 到 Development 分 支 上 ， 以 修复 Development 分 支 上 的 缺陷 。 








V0.1 V0.2 V1.0 


V 


| v 
Master 名 >( ) Ss 个 本 





、N 





Hotfix -一 飞 ~ - S: TN 1 
Release CT| 网 代 
Development ------- > > 人 > Sa) 和 
\ pal 性 

Featurel Se 和 {) >C) te 

式 


Feature? ------ CY >( ) >( ) >( ) tn 


图 8-14 ”Gitflow 分 支 模 式 


Gitflow 分 支 模 式 是 特性 分 支 模式 和 三 驾 马 车 分 支 模式 的 组 合 。 它 的 优点 是 每 个 分 支 的 
定义 都 明确 且 清 晰 ， 而 带 来 的 问题 是 分 支 较 多 ， 具 有 特性 分 支 的 不 足 。 























8.3.3 ”GitHubFlow 分 支 模式 


GitHubFlow 分 支 模式 如 图 8-15 所 示 。 这 种 开发 分 支 模式 的 名 称 来 源 于 GitHub 团 队 的 工 
作 实 践 。 它 对 开发 者 的 开发 纪律 要 求 比较 严格 ， 对 质量 保障 手段 的 要 求 也 比较 高 。 一 个 开 
发 人 员 在 开发 新 特性 或 修改 缺陷 时 ， 甚 工作 步骤 如 下 。 

(1) 从 Master 上 创建 一 个 新 的 分 支 ， 以 这 个 特性 或 缺陷 的 编号 命名 该 分 支 。 

(2) 在 这 个 新 创建 的 分 支 上 提交 代码 。 
(3) 功能 开发 完成 ， 并 自 测 通 过 ， 创 建 Pull Request (简称 为 PR)。 
(4) 其 他 开发 人 员 对 这 个 PR 进行 审查 ， 确 认 质 量 合格 后 ， 合 人 Master。 
ys 质量 达标 的 版 本 


























Master 





图 8-15 ”GitHubFlow 分 支 模式 





妇 
模式 。 


8.4 分 支 策 略 的 选择 


企业 需要 根据 开发 或 维护 的 软件 产品 类 型 ,结合 发 布 频率 ,并 考虑 自身 团队 成 员 能 
和 基础 设施 水 平 如 自动 化 测试 程度 、 程 序 运 行 环境 的 管理 水 平 、 团 队 纪律 性 等 ， 来 确定 适 
合 自己 的 分 支 方式 。 


8.4.1 版 本 发 布 模式 


版 本 发 布 的 基本 模式 有 3 种 。 分 别 是 项 目 制 发 布 模式 (Project Release Mode)、 发 布 火 
车 模式 (Release Train Mode) 和 城 际 快 线 模式 (IntercityExpress Mode) 。 无 论 哪 种 发 布 模 
式 ， 都 有 相同 的 3 个 约束 变量 ， 即 交付 时 间 点 (schedule)、 特性 
特性 数量 (features) 和 交付 质量 (quality) 。 在 团队 资源 相 
对 固定 的 情况 下 ,只 能 对 其 中 的 两 个 因素 提出 固定 的 要 求 。 
例如 ， 对 发 布 的 交付 时 间 点 和 交付 质量 提出 固定 要 求 后 ， 
那么 该 版 本 的 特性 数量 也 就 相对 固定 了 ， 如 图 8-16 所 示 。 

1. 项 目 制 发 布 模式 时 间 一 一 一 一 一 一 一 一 一 质量 

项 目 制 发 布 模式 是 指 在 软件 研发 规划 中 , 预先 确定 某 。 ”图 8-16 版 本 发 布 模式 三 要 素 
一 版 本 所 需 包 含 的 功能 特性 数量 ， 只 有 当 该 集合 内 的 所 有 特性 全 部 开发 完成 并 且 达 到 相 


果 特 性 分 支 的 存在 时 间 很 短 ， 则 该 模式 可 被 认为 是 高 频 的 “主干 开发 ， 主 干 发 布 ” 
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应 的 发 布 质量 标准 后 ， 才 能 发 布 该 版 本 。 前 后 两 次 发 布 乙 间 的 时 间 间 隔 并 没有 明确 的 规 
定 ， 而 是 在 根据 新 版 本 要 求 的 特性 集合 开发 完成 并 达到 发 布 标准 后 ， 对 所 需 时 间 进 行 评 
估 确 定 的 。 

这 种 模式 是 最 古老 的 发 布 方式 ， 其 目标 是 : 针对 一 个 特定 版 本 ， 在 确定 了 版 本 中 的 特 
性 数量 和 质量 标准 以 后 ， 再 估计 版 本 交付 周期 ， 这 相当 于 固定 了 特性 数量 和 质量 要 求 ， 那 
团队 可 能 交付 的 时 间 点 也 就 相对 固定 了 。 

项 目 制 发 布 的 好 处 在 于 : 可 以 确切 地 知道 每 个 版 本 包括 哪些 具体 功能 ， 有 利于 商业 套 
装 软件 的 售卖 模式 〈 卖 版 本 副本 和 授权 ， 收 取 软 件 维护 费用 ， 当 包含 有 新 功能 的 版 本 发 行 
后 ， 再 向 客户 收取 新 版 本 的 升级 费用 )。 同 时 ， 这 也 符合 人 们 的 安全 生产 习惯 ， 即 绝对 不 
能 把 未 完成 的 功能 带 到 即将 发 布 的 版 本 中 。 

不 足 之 处 在 于 : 通常 项 目 整个 交付 周期 较 长 ， 参 与 人 员 众 多 。 在 版 本 研发 周期 中 由 于 
某 些 原因 导致 需求 变更 (如 增加 需求 、 修 改 原 有 需求 实现 方式 或 者 进行 需求 置换 ) 时 ， 需 
要 重新 确定 项 目的 交付 时 间 ， 这 会 影响 那些 原本 能 够 按期 交付 的 需求 。 因 为 ， 这 种 项 目 制 
发 布 模式 需要 等 所 有 需求 全 部 实现 完成 后 才能 一 起 发 布 。 

2. 发 布 火车 模式 

发 布 火车 模式 常见 于 大 型 套装 分 发 类 软件 。 大 型 传统 软件 企业 通常 有 多 条 产品 线 ,各 

品 线 之 间 存 在 非常 复杂 的 相互 依赖 关系 。 为 了 能 够 使 各 产品 线 协同 发 布 ， 这 些 企业 通常 
会 为 每 条 产品 线 都 制订 好 每 个 版 本 的 发 布 周 期 , 即 每 个 版 本 都 像 一 列 火车 ,事先 计划 好 什 
么 时 间 点 发 车 。 为 了 能 够 准时 发 布 ， 要 求 所 有 参与 到 该 版 本 开发 的 团队 必须 对 齐 该 版 本 的 
各 个 开发 阶段 。 这 种 严格 的 时 间 一 致 性 要 求 是 因为 该 产品 线 的 时 间 变 更 会 引起 其 他 产品 线 
的 变更 ,而 这 些 更 改 很 可 能 影响 共享 的 系统 集成 测试 环境 的 分 配 。 在 大 多 数 情况 下 ， 由 于 
计划 和 集成 依赖 关系 ， 因 此 发 布 火车 设置 为 季度 交付 窗口 ， 但 通常 不 会 超过 10 个 月 。 

当 公 布 这 种 火车 时 间 表 时 ， 发 布 管理 团队 通常 与 负责 各 产品 开发 的 团队 进行 提前 沟 
通 ， 讨 论 要 发 布 哪 些 内 容 ， 有 时 甚至 需要 提前 几 个 月 的 时 间 ， 并 将 其 结论 发 布 在 企业 版 本 
表 中 ， 类 似 于 图 8-17 中 LiberOffice 的 发 布 火车 的 时 刻 表 。 提 前 儿 个 月 制订 发 布 火车 的 时 间 
表 ， 目 的 是 让 各 种 业务 和 技术 部 门 有 足够 多 的 时 间 进 行 预计 划 ， 以 便 做 出 依赖 和 影响 的 相 
关 评估 工 作 。 

制订 发 布 计划 的 活动 是 一 个 非常 正式 和 结构 化 的 过 程 , 需要 一 些 格式 化 数据 ， 以 确保 
参加 发 布 火车 的 团队 能 够 对 正式 发 布 的 可 行 性 做 出 判断 。 这 些 数 据 包括 发 布 详细 信息 ( 相 
对 标识 、 名 称 、 部 署 日 期 、 风 险 级 别 、 发 布 类 型 -企业 、 计 划 或 投资 组 合 )、 整 个 生命 周期 
中 各 个 阶段 及 预定 日 期 (如 图 8-18 所 示 )、 每 个 阶段 要 完成 的 活动 和 任务 、 里 程 碑 时 间 和 质 
量 要 求 以 及 负责 管理 发 布 火车 的 主要 负责 人 。 
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图 8-17 LiberOffice 的 发 布 火车 的 时 刻 表 





6.0 release 





Basic dates for the initial and bugfix releases 
Release Freeze Publishing 
6.0.0 (freeze: week 2) 
6.0.1 
6.0.2 
6.0.3 
6.0.4 
6.0.5 
6.0.6 Week 28 , Jul 9, 2018 - Jul 15, 2018 Week 31 , Jul 30, 2018 - Aug 5, 2018 | 
6.0.7 Week 40 , Oct 1, 2018 - Oct 7, 2018 Week 43 , Oct 22, 2018 - Oct 28, 2018 | 
End of Life [ November 26, 2018 | 


























图 8-18 ”LibreOffice 6.0 发 布 火 车 的 时 间 表 


该 模式 的 好 处 在 于 : 对 企业 来 说 ， 可 以 通过 并 行 多 列 火车 的 方式 ,将 突 发 需求 排 入 茶 
一 列 发 布 火车 。 用 户 可 以 提前 体验 最 新 产品 版 本 所 提供 的 新 特性 ， 而 不 必 影 响 原 有 生产 线 
上 正在 使 用 的 旧版 本 。 体 验 之 后 再 决定 是 否 将 其 应 用 于 自己 的 生产 环境 中 。 即 便 已 经 决定 
将 这 个 新 版 本 用 于 自己 的 生产 环境 中 ， 也 可 以 等 到 这 个 新 版 本 成 熟 稳定 之 后 再 这 么 做 。 在 
这 种 模式 下 ， 如 果 参 与 团队 的 人 数 较 多 ， 沟 通 协调 成 本 就 会 较 高 。 
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3. 城 际 快 线 模式 

城 际 快 线 模式 是 指 在 发 布 模式 三 要 素 中 , 国定 其 中 的 时 间 和 质量 两 个 维度 ， 且 时 间 周 
期 相对 较 短 〈 如 一 周 ， 甚 至 一 天 或 更 少 ) ， 针 对 那些 在 发 布 时 间 点 已 达到 固定 质量 标准 的 
特性 进行 一 次 发 布 。 它 与 发 布 火车 模式 的 区 别 在 于 两 点 : 一 是 发 布 周期 间隔 较 短 ， 通 常 在 
两 周 以 内 ; 二 是 负责 特性 开发 的 团队 可 以 自己 选择 搭乘 哪 列 城 际 快 线 ， 而 不 必 提 前 很 长 时 
间 确 定 下 来 。 

这 种 模式 常见 于 提供 互联 网 服务 或 SaaS 服 务 的 软件 公司 。 其 好 处 在 于 减少 了 团队 及 角 
色 之 间 的 协调 成 本 。 因 为 每 个 人 都 事先 知道 每 次 发 布 的 具体 时 间 点 ， 所 有 工作 任务 都 可 以 
按 这 个 时 间 点 提前 进行 协调 。 而 且 ， 即 使 某 个 特性 没有 及 时 赶 上 最 近 的 一 次 版 本 发 布 ， 团 
队 也 确切 地 知道 这 个 特性 是 否 可 以 在 下 一 次 发 布 时 间 点 对 外 发 布 。 例 如 ，Facebook 的 Web 
网 站 在 2013 年 的 部 署 推送 频率 已 达到 每 天 发 布 两 次 ， 每 周 发 布 一 次 大 版 本 。 其 分 支 发 布 策 
略 如 图 8-19 所 示 。 
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图 8-19 Facebook 2013 年 的 分 支 发 布 策略 


每 个 周 日 从 主干 上 拉 一 个 发 布 分 支 ， 自动 化 测试 验证 通过 以 后 ， 即 在 公司 内 部 人 员 开 
放 (在 公司 内 访问 ， 直 接 重 定向 到 latest.facebook.com)。 运 行 过 程 中 如 果 出 现 缺 陷 ， 可 以 
在 主干 上 修复 ， 然 后 分 捡 到 (CherryPick) 发 布 分 支 上 。 发 布 分 支 上 的 代码 每 天 两 次 更 新 
latest.facebook.com， 供 公司 员工 开发 使 用 。 如 果 版 本 稳定 ， 就 向 外 部 用 户 发 布 ， 同 样 是 每 
天 两 次 。 据 报道 ， 自 2017 年 开始 ，Facebook 公 司 网 站 的 分 支 发 布 策略 已 经 从 一 天 发 布 两 次 
的 “主干 开发 ， 分 支 发 布 ” 模 式 改 变 为 平均 每 天 发 布 9 到 10 次 的 “主干 开发 ， 主 干 发 布 ” 
模式 。 
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这 种 城 际 快 线 模式 的 优点 有 两 个 , 一 是 每 个 人 都 非常 清楚 各 个 时 间 点 ,二 是 更 加 聚焦 
于 生产 质量 。 

当然 ， 也 有 其 不 足 之 处 ， 由 于 发 布 频率 较 高 ， 因 此 未 完成 功能 的 代码 也 会 一 同 发 布 出 
去 ， 对 于 代码 提交 质量 的 要 求 较 高 ， 需 要 强大 的 质量 基础 设施 保证 。 

使 用 这 种 城 际 快 线 模 式 ， 间 隔 多 长 时 间 发 出 一 趟 合适 呢 ? 我 的 建议 是 : 在 不 影响 用 户 
体验 、 不 增加 成 本 且 合 规 的 前 提 下 ， 让 发 布 周 期 尽 可 能 缩短 到 令 你 感到 有 些 紧 张 的 市 奏 。 
例如 ， 原 来 每 个 月 发 布 一 个 版 本 ， 现 在 可 以 把 两 周作 为 一 个 目标 。 


8.4.2 ”分支 策略 与 发 布 周期 的 关系 


分 支 策略 与 版 本 发 布 周 期 之 间 有 一 定 的 相关 性 ， 如 图 8-20 所 示 。 通 常 ， 软 件 开 发 周期 
极 长 的 “项 目 制 ”团队 和 软件 发 布 频率 极 高 的 “ 城 际 快 线 式 ”团队 会 使 用 “主干 开发 , 主 
干 发 布 ” 的 分 支 策 略 。 而 次 之 的 团队 会 使 用 “主干 开发 ,分 支 发 布 ” 的 分 支 策略 。 它 们 之 
间 的 团队 会 使 用 “分 支 开 发 、 主 干 发 布 ” 的 分 支 策略 。 当 然 ， 这 并 不 是 绝对 的 ， 其 中 会 有 
很 大 的 重 址 部 分 ， 通 常会 受 团队 成 员 人 数 、 产 品 架构 和 质量 保障 基础 设施 状况 的 影响 。 
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图 8-20 ”分支 策略 与 发 布 周期 的 关系 示意 医 














项 目 制 发 布 模式 不 会 消失 。 毕 竟 每 个 新 产品 在 完成 第 一 个 可 推广 的 1.0 版 本 前 ， 都 需 
要 这 样 一 个 首次 启动 过 程 。 目 前 仍旧 有 很 多 传统 IT 企业 采用 项 目 制 发 布 模式 。 

城 际 快 线 模式 是 “持续 交付 2.0” 所 提倡 的 模式 。 越 来 越 多 的 企业 开始 使 用 这 种 城 际 
快 线 模式 。 即 使 在 那些 目前 的 版 本 发 布 周 期 较 长 的 企业 中 ， 也 常常 在 项 目 制 发 布 模式 中 人 套 
用 城 际 快 线 模式 ， 即 在 项 目 周期 内 加 入 固定 时 间 的 迭代 ， 并 要求 在 每 个 迭代 结束 时 都 能 得 
到 可 交付 状态 的 产品 。 这 里 的 可 交付 状态 是 指 软件 可 以 正常 运行 ， 且 已 完成 的 软件 特性 达 
到 发 布 质量 标准 ， 并 非 商业 化 发 布 。 

一 般 来 说 ， 当 发 布 周期 缩短 到 一 定 程度 后 ， 主 干 开发 模式 更 具有 优势 ， 因 为 分 支 开发 
模式 的 合并 成 本 会 成 为 短 周 期 发 布 的 障碍 。 如 果 发 布 周 期 短 于 两 周 ， 软件 团队 就 应 该 毫 不 
犹豫 地 转向 “主干 开发 模式 "。 








8.5 小结 


每 种 分 支 策略 都 有 甚 各 自 的 优点 和 挑战 。 并 且 ， 它 对 发 布 频率 和 每 次 发 布 的 效率 也 
有 较 大 的 影响 。 目 前 的 发 展 趋势 是 : 软件 发 布 频率 越 来 越 高 ， 发 布 周期 越 来 越 短 。 硅 谷 
顶级 互联 网 公司 多 采用 “主干 开发 ”或 高 频 的 GitHubFlow 分 支 模式 。 一 个 企业 到 底 选择 
哪 种 分 支 策 略 ， 需 要 根据 团队 的 具体 情况 来 决定 。 如 果 相 关 的 配套 条 件 (如 软件 架构 、 
人 员 能 力 和 工具 平台 的 成 熟 度 ) 不足， 那么， 盲目 提高 发 布 频率 、 缩 短发 布 周期 会 造成 
不 必要 的 损失 。 

“持续 交付 2.0” 提 倡 鼓 励 持续 集成 的 分 支 策 略 ， 因 此 ， 选 择 分 支 模 式 的 原则 有 以 下 


























几 条 。 
(1) 分 支 越 少 越 好 ， 最 好 只 有 一 条 主干 。 
(2) 分 支 生 存 周 期 越 短 越 好 ， 最 好 在 3 天 以 内 。 
(3) 在 业务 允许 的 前 提 下 ， 发 布 周 期 越 短 越 好 。 
企业 管理 者 应 该 遵循 “持续 交付 2.0” 的 思想 、 理 念 与 原则 ， 制 订 合 理 的 改善 目标 ， 
促进 公司 IT 交付 能 力 不 断 提升 ， 才 能 够 跟 上 时 代 的 发 展 。 





和 
持续 集成 





1999 年 起 ,“ 持 续集 成 ”作为 一 种 软件 开发 实践 ， 随 着 敏捷 运动 的 兴起 而 走 入 

软件 行业 的 大 众 视野 。 在 敏捷 运动 所 提倡 的 众多 原则 、 方 法 与 实践 中 ,，“ 持 续 

集成 ”也 是 第 一 个 被 广泛 接受 和 认可 的 工程 实践 ， 甚 至 有 些 人 误 将 “持续 集成 ”与 “敏捷 
软件 开发 ” 画 上 了 等 号 。 

本 章 主 要 讨论 持续 集成 的 源 起 与 定义 , 团队 与 个 人 的 持续 集成 工作 流 , 不 同 分 支 策 略 

下 持续 集 和 部 署 流 水 线 的 联系 ， 以 及 在 实施 持续 集成 过 程 中 经 常 遇 到 的 问题 与 应 对 方法 。 


9.1 起 源 与 定义 


说 到 “持续 集成 ”的 起 源 ， 就 必须 回忆 一 下 20 世 纪 60 年 代 末 的 一 个 著名 软件 项 目 ， 它 
就 是 Chrysler Comprehensive Compensation System (简称 C3 项 目 )。 这 个 项 目 并 不 算 成 功 。 
之 所 以 “不 算 成 功 ”， 是 因为 该 项 目的 投资 回报 率 很 低 。 之 所 以 “著名 ”， 是 因为 我 们 现在 
用 到 的 很 多 软件 开发 实践 在 这 个 项 目 中 都 有 所 应 用 ， 包 括 “ 持 续集 成 ”。 

C3 项 目 于 1993 年 启动 ，1994 年 用 Smalltalk 开 发 ， 终 极目 标 是 在 1999 年 支持 87000 雇 员 
的 综合 人 事 与 工 资 系 统 。 直 到 1996 年 ， 这 个 软件 系统 还 无 法 运行 。 因 此 ，Kent Beck 受 邀 挽 
救 这 个 项 目 。 随 后 ，Kent Beck 又 邀请 了 Ron Jeffries。 该 软件 团队 在 1996 年 3 月 进行 了 项 目 
估算 ， 这 个 系统 预计 还 需要 一 年 的 时 间 才 能 上 线 使 用 。 在 1997 年 , Kent Beck 已 经 在 开发 团 
队 中 全 面 使 用 了 新 的 软件 开发 方法 〈 也 就 是 极限 编程 方法 ) 。 虽 然 也 有 所 延期 ， 但 是 一 年 
交付 的 目标 达到 了 。 延 期 的 主要 原因 是 有 一 些 业务 需求 没有 说 清楚 。 软 件 发 布 之 后 ， 这 个 
版 本 仅 能 支持 10000 人 使 用 ,后 续 虽然 进行 了 优化 ,但 是 最 终 也 没有 第 二 个 版 本 上 线 使 用 ， 
直到 2000 年 这 个 项 目 被 取消 。 

有 趣 的 是 ， 这 个 项 目 孕 育 了 很 多 软件 开发 实践 ， 其 中 之 一 就 是 持续 集成 。 当 Kent Beck 
刚刚 接手 这 个 项 目 时 ， 有 一 个 非常 令 人 头疼 的 问题 ， 那 就 是 “把 项 目 代码 集成 在 一 起 ， 局 
动 并 运行 起 来 "。 这 一 集成 联 调 的 过 程 非 常 痛苦， 常常 一 两 周 才 能 搞定 。 于 是 他 们 决定 经 常 
做 系统 集成 工作 ,集成 频率 逐渐 提高 。 虽 然 在 刚 开始 提 高 集成 频率 时 ， 团 队 感觉 比较 痛 苗 ， 
但 是 每 次 集成 所 花费 的 时 间 显 硝 减少 , 而 且 集 成 过 程 中 发 现 的 问题 比 之 前 更 容易 定位 修复 。 

于 是 ， 团 队 人 员 有 了 更 加 疯狂 的 想法 :“ 既 然 提 高 集成 频率 可 以 让 问题 更 早 且 更 容易 
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发 现 ,修复 时 间 更 少 ， 那 么 ， 为 什么 不 做 得 更 频繁 一 些 ， 在 每 次 提交 代码 以 后 就 做 代码 集 
成 呢 ? ”于 是 ， 团 队 的 开发 人 员 就 写 了 一 系列 的 shell 脚 本 ， 其 用 途 是 : 通过 定期 访问 代码 
仓库 ， 只 要 发 现 有 新 的 代码 变化 ， 就 将 代码 自动 拉 取 到 一 台 事 先 准备 好 构建 环境 的 干净 机 
器 上 (事先 在 这 台 机 器 上 已 安装 好 编译 所 需 的 工具 或 库 ) ， 进 行 构建 。 一 旦 结束 ， 就 会 将 
构建 结果 通过 屏幕 显示 出 来 。 

尽管 在 那个 年 代 里 ,持续 集成 服务 器 这 种 软件 工具 还 没有 出 现 , 但 这 并 不 妨碍 持续 集 
成 实践 的 开展 。 在 这 个 C3 项 目 中 , 还 实施 了 极限 编程 方法 的 其 他 一 些 实践 。 与 持续 集成 密 
切 相关 的 实践 是 测试 驱动 开发 Test-driven development，TDD)。 之 所 以 说 “密切 相关 ”， 
是 因为 在 持续 集成 的 构建 过 程 中 ,一定 要 对 软件 的 质量 进行 验证 ， 而 运行 自动 化 的 单元 测 
试 集 就 是 质量 验证 的 一 个 重要 手段 。 


9.1.1 原始 定义 


早 在 20 世 纪 80 年 代 ， 微 软 Office 产 品 研发 团队 就 使 用 一 种 开发 实践 ， 称 作 每 日 构建 
(dailybuild)， 也 叫 每 晚 构建 (nightly build)。 它 是 指 每 天 定时 自动 执行 一 次 软件 构建 工作 ， 
也 就 是 将 当前 版 本 控制 系统 中 的 源 代 码 检 出 到 一 个 构建 环境 ( 即 没 有 安装 集成 开发 环境 的 
干净 机 器 ) 中 ， 对 其 进行 编译 、 链 接 、 打 包 的 过 程 。 

执行 每 日 构建 有 助 于 确保 开发 人 员 明 确 了 解 他 是 否 在 前 一 天 的 代码 编写 过 程 中 引入 
了 新 的 问题 。 每 日 构建 通常 包含 少量 的 自动 化 冒 烟 测 试 ， 这 可 以 帮助 团队 确定 是 否 新 的 变 
更 破坏 了 原 有 的 功能 。 其 关键 部 分 在 于 ， 每 次 构建 一 定 要 包含 新 的 代码 修改 和 测试 。“ 冒 
烟 测 试 ” 这 一 术语 来 源 于 电子 硬件 测试 。 硬 件 样 品 只 要 通电 后 没有 冒 烟 ， 就 说 明 该 硬件 最 
基本 的 质量 要 求 达 到 了 。 

而 “持续 集成 ”实践 来 自 1996 年 Kent Beck 提 出 的 极限 编程 方法 (eXtremeProgramming， 
XP)， 并 在 《解析 极限 编程 一 一 拥抱 变化 》 的 第 10 章 给 出 了 一 个 简短 说 明 :“ 持 续集 成 一 一 
每 天 多 次 集成 和 生成 系统 ， 每 次 都 完成 一 个 构建 任务 。 

其 相对 正式 的 定义 来 自 Martin Fowler 在 2000 年 写 的 一 篇 博客 文章 ， 并 在 2006 年 对 它 又 
做 了 进一步 的 分 析 和 说 明 ， 其 定义 如 下 所 述 : 
持续 集成 是 一 种 软件 开发 实践 , 团队 成 员 频 繁 将 他 们 的 工作 成 果 集 成 在 一 起 
(通常 每 人 每 天 至 少 提交 一 次 ， 这 样 每 天 就 会 有 多 次 集成 ); 每 次 提交 后 ， 自 动 甬 
发 运行 一 次 包含 自动 化 验证 集 的 构建 任务 ， 以 便 能 尽早 发 现 集成 问题 。 

































































由 此 可 见 ， 持 续集 成 是 一 种 质量 反馈 机 制 ， 其 目的 是 “尽早 发 现代 码 中 的 质量 问题 "。 
9.1.2 一 次 集成 过 程 
到 目前 为 止 , 能 够 提供 持续 集成 功能 的 平台 或 工具 不 少 于 35 种 , 既 有 商业 收费 软件 (如 
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TeamCity 等 )， 也 有 开源 的 软件 (如 Jenkins、goCD、Buildbot)， 还 有 SaaS 类 工具 平台 (如 
TrvisCI) ， 但 是 持续 集成 的 一 次 执行 流程 都 是 相同 的 ， 如 图 9-1 所 示 。 

(1) 开发 人 员 将 代码 提交 到 代码 仓库 。 

(2) 持续 集成 服务 器 按 一 定 的 时 间 间 隔 〈 如 每 隔 1 分 钟 ) 对 代码 仓库 进行 轮 询 ， 发 现 
有 代码 变更 。 

(3) 持续 集成 服务 器 自动 将 最 新 代码 检 出 到 已 准备 好 的 专用 服务 器 上 (如 果 应 用 规模 
不 大 ， 可 以 与 持续 集成 服务 器 是 同一 台 机 器 )。 

(4) 在 专用 服务 器 上 运行 由 持续 集成 服务 器 指定 的 构建 脚本 或 命令 ， 对 最 新 代码 进行 
检查 〈 如 代码 动静 态 扫描 、 编 译 打包 、 运 行 单元 测试 、 部 署 并 运行 功能 测试 等 ) 。 

(5) 运行 结束 后 ， 将 验证 结果 成功 或 者 失败 ) 反馈 给 开发 团队 。 
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图 9-1 “持续 集成 过 程 

为 了 能 够 做 到 “省 时 省 力 ”"， 可 以 通过 自动 化 方式 运行 大 量 的 质量 检验 项 (包括 自动 
化 测试 、 代 码 规范 检查 、 代 码 安 全 扫描 等 )。 "持续 集成 ”这 一 实践 直接 体现 了 快速 验证 环 
的 基本 工作 原则 ， 即 “质量 内 建 ， 快 速 反馈 “。 每 当 工程 师 完 成 一 项 开发 任务 后 ， 必 须 通 
过 运行 一 系列 的 自动 化 质量 检查 , 验证 其 所 写 代 码 的 质量 是 否 达 到 了 团队 能 接受 的 软件 质 
量 标准 。 
9.2 六 步 提交 法 


极限 编程 方法 非常 强调 纪律 ， 持 续集 成 实践 也 不 例外 。 尤 其 当 团 队 成 员 较 多 ， 且 同时 
在 代码 主干 上 进行 开发 工作 时 ,纪律 更 是 团队 高 效 协作 的 保障 。 持 续集 成 对 每 个 人 的 工作 
步 又 要 求 是 什么 样 的 呢 ?” 作 为 团队 需要 改动 代码 的 人 (无论 是 开发 人 人员、 测试 人 员 还 是 运 
维 人 员 ) ， 每 个 人 都 应 该 遵循 下 面 6 个 工作 步 又， 简称 “六 步 提交 法 ， 如 图 9-2 所 示 。 
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(1) 检 出 最 近 成 功 的 代码 : 工程 师 开 始 工作 时 【〈 例 如 工作 日 早上 刚刚 开工 认领 了 一 个 
新 的 开发 任务 ), 就 要 将 最 近 一 次 构建 验证 成 功 的 代码 版 本 从 团队 的 开发 主干 上 检 出 (check 
out) 到 自己 的 开发 工作 区 中 。 

(2) 修改 代码 : 在 个 人 工作 区 中 对 代码 进行 修改 (包括 实现 产品 新 功能 的 代码 ， 甚 至 
编写 对 应 功能 的 自动 化 测试 用 例 )。 

(3) 第 一 次 个 人 构建 : 当 开 发 工作 完成 并 准备 提交 时 ， 首 先 执行 一 个 自动 化 验证 集 ， 
对 自己 工作 区 的 新 代码 执行 第 一 次 个 人 构建 (有 了 时 也 被 称 为 本 地 构建 )， 用 于 验证 自己 修 
改 的 代码 质量 是 否 达 标 。 

(4) 第 二 次 个 人 构建 : 从 “ 检 出 代码 ”到 “第 一 次 个 人 构建 完成 ”这 段 时 间 内 ， 很 可 
能 在 开发 主干 上 有 其 他 成 员 已 提交 了 新 代码 ， 并 通过 了 持续 集成 的 质量 验证 。 此 时 ， 就 需 
要 将 这 个 版 本 的 代码 与 自己 本 地 修改 的 代码 进行 合并 (merge) ， 然 后 再 次 执行 一 次 质量 验 
证 ， 确 保 自 己 的 代码 与 其 他 人 的 代码 都 没有 问题 。 

(5) 提交 代码 到 团队 主干 ， 当 第 二 次 个 人 构建 成 功 以 后 ， 提 交代 码 到 团队 开发 主干 。 

(6) 提交 构建 : 持续 集成 服务 器 发 现 这 次 代码 变更 ， 立 即 开始 执行 提交 构建 ， 运 行 自 
动 化 质量 验证 。 如 果 这 次 构建 失败 ， 则 应 该 立即 着 手 修复 ， 并 马上 通知 团队 成 员 ， 禁 止 其 
再 向 团队 开发 主干 提交 代码 ， 并 且 不 要 检 出 这 个 版 本 。 
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图 9-2 ”持续 集成 六 步 提交 法 


其 中 , 团队 开发 主干 是 指 团队 成 员 共 同 拥 有 的 一 个 代码 仓库 分 支 ， 即 每 个 开发 人 员 完 
成 任务 以 后 ,需要 将 代码 提交 到 该 分 支 上 ,与 团队 其 他 人 的 代码 合并 在 一 起 个 人 工作 区 
是 指 每 个 团队 成 员 自己 用 于 修改 代码 的 本 地 工作 目录 ; 个 人 构建 是 指 团 队 成 员 在 提交 代码 
变更 到 代码 仓库 之 前 ， 对 自己 的 变更 集 进行 质量 验证 的 活动 ， 其 目标 是 确保 自己 的 代码 修 
改 符 合 功 能 预期 , 同时 也 不 会 破坏 原 有 功能 。 有 时 它 也 被 称 为 “本 地 构建 ”或 “本 地 验证 ”， 
这 是 一 种 历史 传承 下 来 的 叫 法 ， 因 为 这 个 验证 活动 过 去 通常 是 在 自己 本 地 的 开发 机 就 可 以 
执行 。 现在， 由 于 软件 规模 变 大 ， 架 构 变 得 复杂 ， 所 需 资源 增加 ， 因 此 很 多 组 织 已 经 提供 
云 基础 设施 ， 而 这 些 未 提交 的 代码 也 可 以 放 到 云 基础 设施 上 进行 构建 与 测试 了 。 因 此 ,更 
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准确 的 叫 法 应 该 是 “个 人 构建 "。 
9.2.1 4 个 关键 点 


下 面具 体 介 绍 六 步 提 交 法 的 4 个 关键 点 。 

1. 六 步 提交 法 中 的 3 次 验证 有 什么 作用 

在 持续 集成 六 步 提 交 法 中 ， 有 3 次 质量 验证 活动 ， 分 别 是 第 3、4 和 6 步 。 首 先 要 确保 这 
3 次 验证 都 执行 相同 的 命令 和 脚本 。 例 如 ， 对 使 用 gradle 进 行 构建 的 Java 项 目 来 说 ， 你 可 以 
使 用 类 似 “gradle test” 这 样 的 命令 。 

命令 相同 ， 脚 本 一 致 ， 为 什么 还 要 执行 3 次 呢 ? 第 3 步 的 个 人 验证 目标 是 验证 开发 者 
自己 修改 过 的 代码 是 否 正确 。 第 4 步 的 个 人 验证 是 确保 其 他 人 的 代码 与 自己 的 代码 合并 
后 ， 两 部 分 的 代码 质量 都 没有 问题 。 第 6 步 的 提交 构建 验证 是 在 一 个 干净 且 受 控 环 境 中 执 
行 与 第 4 步 个 人 构建 相同 的 内 容 ， 以 确保 开发 人 员 的 本 次 提交 是 完整 旦 无 质量 问题 的 ， 没 
有 遗漏 。 

第 3 步 和 第 4 步 的 验证 内 容 可 能 是 不 一 样 的 。 第 3 步 的 个 人 构建 所 验证 的 内 容 主要 是 开 
发 者 自己 最 初 检 出 和 修改 的 代码 。 第 4 步 的 个 人 构建 所 验证 的 内 容 则 增加 了 团队 其 他 成 员 
刚刚 提交 的 那 部 分 内 容 。 

第 4 步 的 个 人 验证 与 第 6 步 提交 构建 验证 之 间 的 区 别 在 手 构建 的 执行 环境 不 同 。 第 4 步 
的 个 人 验证 在 开发 人 员 自己 的 机 器 上 执行 ， 验 证 自己 修改 但 尚未 提交 的 代码 。 第 6 步 提 交 
构建 验证 的 运行 环境 是 团队 标准 化 环境 ,验证 的 代码 来 自 团队 代码 仓库 的 最 新 版 本 。 假 如 
第 4 步 的 个 人 验证 成 功 ， 而 第 6 步 提交 构建 验证 失败 ， 那 么 很 快 可 以 判断 原因 。 只 有 3 种 可 
能 性 ， 它 们 是 (1) 自己 这 次 代码 提交 并 不 完整 ， 有 一 部 分 代码 修改 被 遗漏 了 ，(2) 自己 
的 机 器 环境 与 整个 团队 标准 化 验证 环境 有 差异 ，(3) 团队 其 他 成 员 在 自己 提交 前 再 一 次 提 
交 了 新 的 代码 ， 但 自己 没有 注意 到 。 

2. 个 人 验证 一 定 要 做 两 次 吗 

第 一 次 个 人 验证 的 目标 是 验证 自己 的 修改 是 符合 质量 预期 的 。 第 二 次 个 人 验证 的 目标 
是 验证 自己 改动 的 代码 和 其 他 人 提交 的 代码 合并 在 一 起 ， 也 符合 质量 预期 。 假如 第 一 次 个 
人 验证 通过 ,而 第 二 次 个 人 验证 失败 ,说 明 从 主干 上 合并 回来 的 代码 对 自己 的 修改 产生 了 
影响 。 因 此 ， 做 两 次 验证 比较 容易 定位 问题 。 

作为 自信 心 爆棚 的 工程 师 , 你 可 能 只 进行 一 次 个 人 验证 ,那么 就 应 该 保留 第 二 次 个 人 
验证 。 因 为 只 有 这 次 验证 成 功 后 ,才能 保证 提交 后 提交 构建 阶段 的 那 次 验证 失败 的 可 能 性 
最 小 ， 以 保证 能 高 效 地 集成 。 

3. 如 何 确 保 在 提交 前 执行 个 人 构建 

很 多 工作 流程 管控 的 负责 人 会 问 : 我 们 如 何 保证 每 个 开发 人 员 在 提交 前 都 已 经 执行 了 
个 人 验证 呢 ? 一 种 方式 是 在 提交 代码 之 时 ， 由 持续 集成 平台 通过 钩子 (hook) 捕获 提交 事 
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件 ， 在 代码 合并 到 主干 之 前 ， 强 制 进行 第 二 次 个 人 验证 。 当 然 ， 我 们 也 可 以 通过 团队 口头 
约定 的 方式 ， 要求 团 队 成 员 遵守 这 一 要 求 。 通 过 对 过 去 一 段 时 间 内 提交 构建 验证 的 失败 次 
数 、 分 布 以 及 失败 原因 的 统计 ， 我 们 也 很 容易 知道 团队 每 个 成 员 所 采用 的 行为 模式 。 

4. 每 次 构建 应 该 包含 哪些 质量 验证 内 容 

自动 化 单元 测试 并 不 能 覆盖 软件 的 所 有 运行 场景 。 因 此 ， 除 单元 测试 以 外 ,我 们 仍旧 
希望 在 个 人 验证 环节 和 提交 构建 验证 中 能 够 运行 更 丰富 的 质量 验证 集合 ,如 代码 动静 态 扫 
描 、 代 码 规范 检查 、 构 建 验证 测试 等 。 在 条 件 人 允许 的 情况 下 ， 如 果 能 够 运行 所 有 的 自动 化 
质量 保证 手段 ， 就 更 棒 了 ! 构建 验证 测试 (build verification test) 是 指 检查 如 下 内 容 。 

(1) 构建 结束 后 生成 的 二 进 制 包 是 否 包 含 了 正确 的 内 容 ， 例 如 配置 文件 的 完整 性 。 

(2) 这 个 构建 结果 是 否 能 够 正确 安装 并 正常 启动 运行 起 来 。 

(3) 启动 后 最 基本 的 功能 是 否 可 以 使 用 ， 如 用 户 登 录 等 。 

代码 规范 检查 的 工具 相对 丰富 且 成 熟 ， 而 且 最 容易 执行 。 它 与 自动 化 测试 相 比 ， 执 行 
成 本 较 低 。 不 需要 团队 自行 编写 大 量 代码 ， 只 需要 制订 团队 的 编码 规范 ， 并 在 规范 检查 工 
具 中 配置 相应 的 扫描 规则 ， 即 可 使 用 。 但 是 ， 对 有 大 量 遗 留 代码 的 代码 库 来 说 ， 代 码 规范 
扫描 很 可 能 存在 一 个 问题 ， 那 就 是 : 对 存量 代码 来 说 ， 经 过 规范 扫描 可 能 发 现 数量 巨大 的 
已 存 问 题 。 如 何 应 对 这 样 的 问题 呢 ? 需要 立即 全 部 清除 吗 ? 此 时 可 以 采用 以 下 两 种 措施 。 

(1) 减少 规范 ， 关 注重 点 。 大 部 分 规范 检查 工具 都 会 将 问题 分 为 多 种 类 型 ， 如 严重 、 
重要 或 警告 。 团 队 应 该 一 起 讨论 ， 提 取 最 重要 的 代码 规范 ， 早 期 只 关注 严重 类 型 的 问题 ， 
以 后 再 逐步 增加 代码 描述 规则 。 

(2) 执行 “童子 军营 地 原则 ”。 假 如 遗留 代码 量 比较 大 ， 并 且 在 生产 环境 中 已 经 运行 
很 入 ， 且 最 近 不 会 修改 它们 ， 那 么 可 以 暂时 不 修改 它们 。 即 使 不 能 立即 将 问题 全 部 清除 ， 
也 要 保证 每 次 提交 代码 时 ， 都 不 让 问题 的 数量 继续 增长 ， 假 如 每 次 都 能 够 递减 就 更 好 了 。 


















































童子 军营 地 原则 
童子 军 是 美国 社会 针对 未 成 年 人 的 一 种 教育 实践 制度 , 加 入 童子 军 的 小 朋友 都 要 学 
习 并 遵守 一 些 规则 ， 然 后 获得 各 种 各 样 的 勋章 。 其 中 有 一 条 是 离开 宿营 地 前 进行 清扫 活 
动 的 原则 ， 简 洁 明 了 : “离开 营地 前 ， 确 保 党 地 和 你 使 用 之 前 一 样 干净 ， 能 再 干净 一 点 
就 更 好 了 。” 





9.2.2 同步 与 异步 模式 

六 步 提 交 法 有 两 种 不 同 的 模式 ， 它 们 分 别 是 “同步 模式 ”和 “异步 模式 ”。 它 们 之 间 
的 区 别 主要 在 于 第 五 步 “ 代 码 提 交 到 主干 ”以 后 开发 人 员 的 行为 差异 。 

在 同步 模式 下 ,开发 人 员 必 须 等 待 第 六 步 “ 提 交 构 建 ” 结 束 并 返回 结果 以 后 ,再 决定 
下 一 步 的 行动 ， 即 “每 个 开发 人 员 编 程 一 段 时 间 后 就 立即 进行 一 次 集成 ， 集 成 时 间 不 应 该 
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超过 10 分 钟 。 等 待 这 次 构建 结束 ， 并 且 整 组 自动 化 测试 运行 完成 ,确认 质量 达标 ， 无 须 回 
退 后 ， 再 开始 下 一 项 工作 ”。 

在 异步 模式 下 ， 开 发 人 员 在 完成 第 3 步 “ 代 码 提 交 ” 后 ， 并 不 需要 等 待 提交 构建 阶段 
结束 ， 就 可 以 着 手 开 始 下 一 项 工作 任务 。 而 持续 集成 服务 器 也 不 一 定 马上 就 开始 执行 提交 
构建 任务 。 它 很 可 能 是 每 隔 30 分 钟 (或 者 更 长 间隔 )， 才 触发 提交 构建 任务 。 

Kent Beck 认 为 ， 与 每 日 构建 相 比 ， 虽 然 异 步 模式 的 持续 集成 是 一 大 改进 ， 但 不 建议 
这 么 做 。 因 为 可 能 存在 “浪费 "。 例 如 ， 直 到 开发 人 员 已 经 开始 下 一 个 任务 了 ， 才 被 通知 
半 小 时 前 提交 的 代码 质量 验证 失败 了 。 此 时 , 开发 人 员 就 要 花 一 些 时 间 回 想 刚才 做 了 什么 ， 
再 定位 和 解决 这 个 问题 ， 并 再 次 提交 。 然 后 还 要 再 花 一 些 精力 回 到 刚刚 新 任务 被 打 断 的 地 
方 。 这 种 任务 之 间 的 切换 ， 也 被 精益 管理 理论 看 作 是 一 种 不 必要 的 “浪费 ”。 


9.2.3” 自 查 表 


如 果 读 者 想 知道 自己 的 团队 是 否 达到 了 持续 集成 的 最 佳 状 态 ， 则 可 以 从 下 面 6 个 方面 
进行 自我 检查 。 

1. 主干 开发 ， 频 繁 提 交 

主干 开发 是 指 参 与 开发 同一 软件 项 目 或 服务 的 所 有 团队 成 员 向 该 软件 项 目 代 码 仓 库 
的 主干 分 支 上 提交 代码 ， 或 者 其 他 分 支 的 生命 周期 不 超过 3 和 天: 频繁 提交 是 指 每 人 每 天 至 
少 提交 一 次 ， 最 好 每 工作 几 小 时 就 进行 提交 。 

2. 每 次 提交 应 该 是 一 个 完整 的 任务 

每 次 提交 的 内 容 应 该 是 有 意义 的 ， 而 不 只 是 为 了 达到 提交 频率 的 要 求 而 随意 提交 代 
码 。 我 们 希望 每 次 提交 的 代码 都 围绕 同一 个 工作 任务 ， 同 时 能 够 提交 该 任务 对 应 的 自动 化 
测试 代码 。 

3. 让 提交 构建 在 10 分 钟 以 内 完成 

工程 师 通常 是 没有 什么 耐心 等 待 的 ,因此 每 次 构建 验证 的 时 间 越 短 越 好 。 尤 其 是 当 团 
队 使 用 “同步 模式 ”时 ， 构 建 验证 的 运行 时 间 尤 其 重要 。 如 果 运 行 时 间 过 长 ， 无 疑 会 降低 
质量 反馈 速度 。 假 如 提交 构建 验证 失败 ， 那 么 开发 人 员 需 要 更 大 的 精力 去 回忆 那 次 提交 的 
工作 上 下 文 ， 去 分 析 可 能 的 问题 所 在 。 

4. 提交 构建 失败 后 应 禁止 团队 成 员 提 交 新 代码 ， 也 不 许 其 他 人 检 出 该 代码 

当 某 个 团队 成 员 提 交代 码 引 起 提交 构建 验证 失败 时 , 说 明 软 件 整体 质量 可 能 存在 问题 
或 风险 。 此 时 ， 整 个 团队 不 应 该 再 继续 提交 新 的 代码 变更 。 这 正 是 应 用 了 丰田 式 生 产 管理 
系统 (Toyota Production System，TPS) 中 的 “立即 暂停 原则 ” (Stop the Line)。 其 指导 思 
想 是 : 当 生 产 线 上 已 经 发 现 了 问题 ， 就 要 马上 停 下 来 立即 解决 。 如 果 在 问题 没有 得 到 解决 
之 前 仍旧 使 生产 线 保持 运行 ， 则 只 会 提高 生产 残 次 品 的 比率 。 

同样 ， 对 软件 团队 来 说 ， 如 果 提 交 构 建 验证 已 经 失败 ， 那么 在 未 修复 之 前 ， 其 他 人 若 
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再 次 提交 新 的 代码 ， 就 一 定 会 引起 提交 构建 验证 失败 。 那 么 ， 这 次 失败 是 由 上 次 失败 的 原 
因 导 致 的 呢 ， 还 是 新 的 代码 本 身 就 有 问题 呢 ? 这 会 使 问题 的 解决 变 得 更 加 复杂 。 

5. 立即 在 10 分 钟 内 修复 已 失败 的 提交 构建 ， 否 则 回 滚 代码 

根据 之 前 的 讨论 ， 提 交 构 建 失败 后 ， 在 问题 被 修复 之 前 ， 团 队 成 员 不 能 提交 代码 。 这 
会 打破 团队 其 他 人 的 开发 节奏 ， 甚 至 令 整 个 项 目 进度 受阻 ， 因 此 应 该 立即 着 手 修复 。 现 实 
中 ， 常 见 的 现象 是 : 正在 修复 问题 的 开发 者 通常 声称 可 以 在 很 短 的 时 间 内 修复 问题 , 但 实 
际 上 花费 的 时 间 往 往 比 实际 预期 的 时 间 要 长 。 因 此 ， 团 队 需 要 制订 类 似 的 工作 原则 :如果 
x 分 钟 之 内 无 法 修复 ， 就 应 该 回 滚 代 码 。 这 样 既 让 修复 问题 的 开发 人 员 有 足够 的 时 间 思 考 
并 解决 回 题 ， 以 免 忙中 出 错 ， 也 能 让 团队 可 以 继续 前 进 。 如 果 修 复 时 间 过 长 ， 会 令 整 个 团 
队 未 提交 代码 的 数量 积累 过 多 ， 那 么 潜在 的 集成 问题 可 能 会 更 多 ,问题 修 复 后 ,积攒 的 大 
量 代码 提交 引起 提交 构建 失败 的 概率 更 大 ， 修 复 时 间 更 长 ， 如 图 9-3 所 示 。 
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可 能 性 和 数量 和 
图 9-3 ”修复 时 间 的 系统 思考 图 


6. 自动 化 构建 验证 通过 后 ， 对 软件 质量 有 比较 大 的 信心 

持续 集成 的 真正 目的 是 得 到 快速 有 效 的 质量 反馈 ， 即 只 要 自动 化 构建 成 功 ， 对 软件 质 
量 就 有 信心 。 我 曾经 遇 到 过 一 个 实施 持续 集成 实践 的 团队 ， 它 完全 做 到 了 前 面 的 5 项 要 求 。 
在 听 到 团队 负责 人 的 描述 时 ， 我 觉得 这 个 团队 的 持续 集成 实践 做 得 不 错 。 然 而 ， 真 实 的 情 
况 却 恰恰 相反 。 团 队 并 不 觉得 他 们 的 持续 集成 有 什么 用 处 。 经 过 详细 了 解 情况 后 才 知 道 ， 
他 们 虽然 有 很 多 自动 化 测试 用 例 , 但 新 增 的 自动 化 测试 用 例 很 少 。 当 原 有 的 自动 化 测试 用 
例 失 败 时 ， 如 果 修 复 比 较 困 难 ， 他 们 就 会 删除 它 。 
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为 了 能 够 更 全 面 地 反馈 软件 质量 , 我 们 可 以 增加 更 多 的 自动 化 功能 测试 用 例 。 而 随 着 
自动 化 测试 的 不 断 增加 ， 我 们 终 将 会 遇 到 自动 化 测试 运行 时 间 太 长 ,无 法 在 10 分 钟 内 反馈 
执行 结果 的 问题 。 那 么 ， 如 何 解决 这 个 问题 呢 ? 





























9.3.1 分 级 构建 

随 着 产品 的 发 展 ， 自 动 化 测试 数量 一 定 会 越 来 越 多 , 运行 时 间 述 早 会 超过 我 们 能 够 妨 
耐 的 极限 。 那 么 ， 如 何 既 能 得 到 质量 反馈 ， 又 能 兼顾 开发 人 员 的 工作 时 间 效 率 呢 ? 一 种 方 
法 就 是 Martin Fowler 在 《持续 集成 》 一 文中 提 到 的 次 级 构建 (Secondary Build) ， 如 图 9-4 
中 四 所 示 。 
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图 9-4 ”持续 集成 的 分 级 构建 


在 图 9-4 中 ， 团 队 将 所 有 自动 化 验证 分 成 两 部 分 so 将 那些 运行 速度 较 快 、 反 馈 质量 高 
的 测试 用 例 ， 放 和 提交 构建 中 ， 而 将 那些 运行 较 慢 或 者 不 经 常 失败 的 测试 用 例 放 在 次 级 构 
建 环节 , 作为 次 级 构建 验证 的 内 容 。 当 提交 构建 验证 成 功 之 后 ,马上 触发 次 级 构建 的 执行 。 
细心 的 读者 一 定 会 发 现 ， 这 已 经 是 “部 署 流水 线 ” 的 纵 形 了 。 

当 在 有 次 级 构建 的 情况 下 , 开发 人 员 只 要 提交 构建 验证 成 功 , 即 可 开展 其 他 工作 任务 ， 
而 不 需要 等 待 次 级 构建 验证 完成 返回 结果 。 但 是 , 一 旦 次 级 构建 验证 失败 ， 应 该 立即 发 出 
通知 。 相 应 的 开发 人 员 收 到 通知 后 应 当 立 即 进行 修复 。 与 此 同时 ， 需 要 通知 团队 所 有 人 ， 
在 问题 修复 以 前 ， 不 能 再 次 提交 代码 。 

那么 , 团队 如 何 决 定 次 级 构建 的 验证 内 容 呢 ?通常 应 该 把 运行 时 间 较 长 或 失败 可 能 性 
比较 低 的 用 例 放 在 次 级 构建 验证 中 , 而 将 运行 速度 快 或 者 容易 失败 的 自动 化 测试 用 例 放 入 
提交 构建 中 。 当 然 ， 构 建 集合 中 的 测试 用 例 并 非 一 成 不 变 。 团 队 成 员 应 该 定期 评估 每 个 构 
建 阶段 所 包含 的 测试 内 容 ， 以 确保 在 提交 构建 时 间 足 够 短 的 前 提 下 ， 尽 可 能 提供 较 高 的 质 
量 反馈 效果 ， 提 升 团队 对 提交 构建 反馈 的 信心 。 
9.3.2 多 人 同时 提交 的 构建 

如 果 次 级 构建 运行 时 间 长 (例如 30 分 钟 以 上 )， 当 多 人 连续 提交 代码 时 ， 很 容易 出 现 
提交 构建 均 已 经 运行 完成 ， 但 前 面 的 次 级 构建 还 没有 结束 ， 仍 旧 在 运行 的 情况 。 这 时 候 ， 
应 该 如 何 处 理 呢 ? 

在 计算 资源 不 受 限 的 情况 下 ,我 们 可 以 在 每 次 提交 构建 成 功 以 后 ,立即 触发 相应 的 次 
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级 构建 ， 这 种 做 法 会 有 资源 浪费 情况 。 例 如 ， 在 图 9-5 中 ， 当 Sara 提 交 的 Rev121 所 触发 的 次 
级 构建 在 10:40 失 败 时 ，Bob 和 Martin 两 人 的 提交 所 触发 的 次 级 构建 已 经 在 运行 中 了 。 此 时 
Sara 还 没有 来 得 及 修复 ， 因 此 Bob、Martin 和 David 的 次 级 构建 一 定 会 失败 。 
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-人 


Saa (RevI2) ID 允 


Bob (Rev122) Em | 
| 
Martin (Rev123) Ci 
David (Rev124) | 





图 9-5 每 次 提交 后 都 有 相应 的 次 级 构建 


当 资 源 受 限 , 或 者 为 了 提高 资源 有 效 利 用 率 , 次 级 构建 验证 可 以 包含 多 人 提交 的 内 容 。 
例如 某 团队 的 提交 构建 需要 运行 10 分 钟 ， 次 级 构建 需要 运行 30 分 钟 。 当 Sara 在 10:00 提 交代 
码 (版 本 为 Rev121) 后 ， 提 交 构 建 开 始 执行 。 当 Bob 在 10:10 提 交代 码 Rev122 时 ，Sara 的 代 
码 刚好 完成 提交 构建 , 触发 了 Rev121 的 次 级 构建 。Rev122 的 提交 构建 也 启动 了 , 以 此 类 推 ， 
Martin 在 10:20 提 交 了 代码 Rev123 ，David 在 10:30 提 交 了 代码 Rev124。 当 Rev124 的 提交 构建 
完成 时 ，Rev121 的 次 级 构建 也 刚好 完成 。 此 时 ， 包 含 Rev122、123 和 124 内 容 的 次 级 构建 会 
被 触发 ， 如 图 9-6 所 示 。 
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图 9-6 ”次 级 构建 的 延迟 触发 


因为 计算 资产 有 限 ， 而 且 尚未 知道 Rev121 的 质量 结果 ， 所 以 图 9-6 中 Rev122 和 Rev123 
的 次 级 构建 没有 被 触发 。 当 Rev121 的 次 级 构建 成 功 之 后 ， 为 了 市 约 时 间 与 资源 ， 可 以 直接 
触发 最 新 版 本 Rev124 的 次 级 构建 。 如 果 Rev124 的 次 级 构建 失败 ， 那 么 为 了 分 析 问 题 原因 ， 
可 以 手工 触发 Rev122 或 Rev123 的 次 级 构建 ， 以 方便 定位 引入 问题 的 版 本 。 


9.3.3” 云 平台 的 威力 


云 计 算 基础 设施 的 发 展 为 持续 集成 提供 了 更 强大 的 资源 支持 和 便利 性 。 我 们 可 以 将 那 
些 比 较 耗 时 和 耗资 源 的 步骤 放 入 云 平台 中 执行 ， 执 行 结束 后 将 验证 结果 通知 构建 的 所 有 
者 。 很 多 验证 都 可 以 使 用 这 种 方法 ,无 论 是 自动 化 单元 测试 ,还 是 自动 化 功能 测试 ， 或 者 
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其 他 质量 验证 内 容 。 这 里 我 们 仅 讨论 与 编译 优化 相关 的 问题 。 

并 不 是 所 有 项 目 都 会 遇 到 编译 优化 问题 ,但 是 这 个 问题 的 确 存在 ,尤其 是 在 大 型 C/C++ 
项 目 中 ， 更 加 常见 。 虽 然 有 动态 库 和 静态 库 这 类 手段 ， 但 是 由 于 语言 本 身 的 特点 ， 为 了 达 
到 高 度 受 控 ，C/C++ 项 目 中 对 源 代码 进行 全 量 编译 是 很 平常 的 事 。 

所 谓 源 代码 全 量 编译 ,是 指 将 该 项 目 所 用 到 的 产品 源 代码 ， 以 及 所 使 用 的 第 三 方 库 源 
代码 都 放 在 一 起 ， 从 头 开始 编译 打包 ， 这 会 导 臻 项 目 编译 打包 的 时 间 超过 10 分 钟 。 本 书后 
续 讲 解 的 两 个 案例 都 遇 到 了 这 个 问题 。 谷 歌 公司 的 C/C++ 项 目 也 使 用 源 代码 编译 ， 因 此 也 
遇 到 了 同样 问题 。 编 译 时 间 过 长 的 后 果 如 图 9-7 所 示 。 
































图 9-7 同步 模式 下 编译 时 间 过 长 的 后 果 





为 了 解决 这 个 问题 ， 还 开发 并 开源 了 一 个 编译 打包 工具 ， 名 为 Bazel。 当 然 ， 可 以 像 
第 14 音 的 案例 那样 ,使 用 商业 工具 IncrediBuild 解 决 问题 , 或 者 像 第 16 音 的 案例 中 的 团队 那 
样 ， 利 用 一 套 开源 解决 方案 ， 定 制 自己 的 编译 云 ， 如 图 9-8 所 示 。 

对 大 多 数 C 语 言及 其 衍生 语言 来 说 ， 编 译 过 程 主要 分 为 预 编译 、 编 译 和 链接 3 个 步骤 。 
能 通过 并 行 执 行 来 提高 速度 的 主要 是 第 二 个 环 市 ， 即 编译 。 在 Linux 环 境 下 ， 比 较 著 名 的 
免费 工具 是 distcc。 它 的 作用 就 是 将 第 二 步 〈 编 译 环节 ) 通过 集群 方式 , 将 编译 任务 分 配给 
集群 中 的 很 多 机 器 ， 每 个 机 器 完成 编译 任务 以 后 ， 将 结果 回 传 ， 用 于 第 三 步 链接 环节 。 但 
是 , 其 速度 提升 的 极限 浆 值 是 3 倍 。 Distcc 的 3.0 版 本 以 后 , 引入 了 基于 Python 的 新 工具 pump。 
它 可 以 将 第 一 个 步骤 中 的 部 分 预 编译 工作 进行 分 布 式 处 理 ， 从 而 提升 编译 效率 。 官 方 网 站 
指出 ， 它 对 文件 传输 、 编 译 过 程 最 高 有 10 倍 的 效率 提升 。 

distcc 仅 根据 服务 器 指定 的 顺序 来 分 配 编 译 任务 ， 无 法 根据 编译 凶 中 服务 器 的 负载 情 
况 进 行动 态 的 编译 任务 分 配 。 而 免费 工具 dmucs 做 简单 的 负载 均衡 。 

既然 不 能 无 限 提 高 编译 速度 ， 我 们 如 何 进一步 解决 问题 呢 ? 在 C/C++ 领 域 ， 与 distcc 
配合 使 用 的 免费 工具 是 ccache。 它 的 作用 是 将 编译 过 程 中 产生 的 中 间 文 件 根 据 预 编译 结果 ， 
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通过 hash 表 缓存 下 来 , 以便 下 次 使 用 。 当 然 , 只 有 命中 缓存 , 才能 提升 编译 速度 。 对 C/C++ 
项 目 而 言 ， 这 种 增 量 编译 有 一 定 的 出 错 风险 ， 因 此 通常 在 最 终 正 式 交付 前 都 会 做 一 次 源 代 
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编译 
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图 9-8 ”利用 开源 工具 建设 Linux 下 的 C/C++ 编 译 云 平 台 


Java 也 同样 有 一 些 工 具 支持 编译 构建 加 速 。 例 如 ，Facebook 公 司 的 开源 项 目 Buck 就 是 
参考 谷歌 公司 的 C/C++ 分 布 式 编译 系统 , 为 Java 量 身 定制 的 编译 构建 版 本 , 而 Gradle 工 具 现 
在 也 有 增 量 编译 功能 。 

如 果 上 述 方法 都 已 应 用 , 但 编译 时 间 仍 旧 不 满足 需求 ,那么 ,就 需要 对 编译 构建 脚本 
和 产品 代码 进行 优化 了 。 例 如 ， 对 C++ 项 目 而 言 ， 尽 量 不 要 把 代码 的 实现 函数 体 部 分 写 到 
头 文件 中 。 因 为 ， 每 个 包含 这 个 头 文件 的 .cpp 文 件 在 编译 时 ， 都 会 把 这 个 头 文件 中 的 函数 
实现 体 编译 到 对 应 的 .obj 文 件 中 。 而 在 “链接 ”时 , 会 再 把 这 些 重复 的 编译 结果 过 滤 出 来 ， 
仅 保留 一 个 就 够 用 了 。 

对 于 Windows 平 台 的 应 用 软件 开发 , 你 可 以 通过 重新 组 织 Solution 文 件 , 来 优化 一 部 分 
编译 时 间 。 而 对 于 Java 项 目 , 你 也 可 以 将 一 个 大 项 目 分 解 成 多 个 小 的 子 项 目 , 如 第 7 章 中 所 
讲 的 GoCD 团 队 那 样 ， 将 一 个 Java 大 项 目 拆 分 成 多 个 组 件 ， 先 对 各 种 组 件 分 别 进行 编译 打 
包 ， 再 组 装 在 一 起 。 


9.4 在 团队 中 实施 持续 集成 实践 


随 着 IT 基础 设施 及 其 技术 的 发 展 以 及 工具 链 的 不 断 完 善 , 持续 集成 实践 的 门槛 已 经 越 
来 越 低 。 那 么 ， 如 何 快速 开始 持续 集成 实践 呢 ? 




















9.4.1 快速 建立 团队 的 持续 集成 实践 
下 面 介绍 需要 维护 遗留 代码 库 的 困 队 建立 持续 集成 实践 的 5 个 步 又， 如 图 9-9 所 示 。 
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图 9-9 ”持续 集成 实施 五 步 法 


1. 构建 脚本 化 ， 搭 建 持续 集成 框架 

(1) 选择 一 款 持续 集成 工具 ， 并 完成 安装 部 署 。 大 多 数 持续 集成 工具 都 与 软件 开发 语 
言 无 关 ， 因 此 可 以 放心 选择 。 目 前 国内 比较 流行 的 工具 是 Jenkins。 如 果 你 的 项 目 是 原生 云 
应 用 ， 也 可 以 使 用 持续 集成 云 化 服务 。 

(2) 在 该 持续 集成 工具 上 建立 一 个 构建 任务 ， 可 以 从 你 的 代码 仓库 拉 取 代码 。 

(3) 写 一 个 脚本 文件 ， 可 以 自动 完成 软件 项 目的 编译 、 构 建 和 打包 工作 。 
(4) 修改 刚刚 在 该 持续 集成 工具 上 创建 的 构建 任务 ， 使 其 可 以 调用 写 好 的 这 个 脚本 
文件 。 

(5) 向 仓库 提交 一 次 代码 ,验证 该 持续 集成 工具 可 以 发 现 有 新 代码 提交 ， 并 拉 取 正确 
的 代码 版 本 ， 运 行 指定 的 构建 脚本 。 

2. 向 构建 中 添加 已 有 的 自动 化 验证 集合 

(1) 向 构建 中 添加 自动 化 测试 用 例 。 通 常 来 说 , 很 多 具有 遗留 代码 的 大 型 团队 通常 都 
会 有 一 些 自动 化 测试 用 例 集 。 如 果 情 况 的 确 如 此 ， 那 么 想 办 法 尽快 将 至 少 一 个 自动 化 测试 
用 例 放 到 这 个 构建 任务 中 ， 使 其 能 够 在 触发 后 自动 执行 。 


@ 持续 集成 环境 基本 可 运行 
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(2) 向 构建 中 加 入 代码 规范 扫描 。 市 场 中 有 很 多 代码 规范 和 健康 度 自 动 化 扫描 工具 (如 
SonarQube、Android Lite、CCCC、cppcheck、Clang、Pclint 等 ， 当 然 也 有 很 多 商业 化 工具 ， 
如 Coverity 等 )。 如 果 团 队 已 有 相关 编程 语言 的 代码 编写 规范 ， 就 可 以 选择 其 中 一 种 工具 ， 
将 其 加 入 前 面 创 建 的 构建 任务 中 ， 执 行 代码 的 自动 扫描 工作 。 

3. 选择 利于 持续 集成 的 分 支 策略 

前 面 两 个 步 又 完成 后 ,团队 已 经 具备 持续 集成 的 基础 。 现 在 需要 选择 一 种 利于 持续 集 
成 的 分 支 策略 。 每 个 分 支 都 应 该 建立 对 应 的 持续 集成 环境 。 而且， 如 果 分 支 过 多 ， 则 不 利 
于 团队 的 持续 集成 效果 。 因 此 ， 团 队 应 该 根据 实际 情况 ， 选 择 一 种 利于 持续 集成 的 分 支 策 
略 ， 并 为 之 建立 相应 的 自动 化 部 署 流 水 线 。 

4. 建立 六 步 提交 法 
团队 现在 已 经 将 整个 持续 集成 流程 跑 通 。 虽然 构建 任务 中 还 只 包含 少量 的 质量 验证 活 
动 ， 但 是 一 个 不 错 的 起 点 了 。 如 果 项 目的 编译 时 间 过 长 ， 可 以 参考 本 章 的 “编译 优化 ” 相 
关 讨 论 来 解决 时 间 问 题 。 如 果 因 为 代码 库 过 大 ， 代 码 规范 扫描 需要 时 间 较 长 ， 此 时 可 以 退 
一 步 使 用 增 量 扫描 的 方式 ， 来 缩短 时 间 。 

当 基 本 达到 六 步 提交 法 的 时 间 要 求 后 ， 就 可 以 对 团队 成 员 进 行 培训 ,指导 团队 成 员 按 
照 持 续集 成 六 步 提 交 法 的 方式 进行 日 常 的 开发 工作 。 

5. 持续 优化 

接 下 来 的 工作 是 对 其 进行 优化 。 通常 对 那些 有 很 多 遗留 代码 和 大 量 自动 化 测试 用 例 的 
企业 来 说 ， 很 难 做 到 六 步 提交 法 所 设 定 的 时 间 要 求 ， 而 且 还 会 有 很 多 原来 不 成 为 问题 的 问 
题 。 例 如 , 某 测 试 团 队 开 发 了 数 十 个 自动 化 测试 用 例 , 但 是 由 于 自动 化 测试 编码 质量 不 好 ， 
在 非 人 工 干预 的 情况 下 ， 批 量 执行 这 些 自动 化 用 例 ， 其 运行 结果 非常 不 稳定 ， 经 常会 出 现 
一 些 随机 失败 。 随 机 失败 是 指 在 一 切 条件 都 没有 发 生变 化 的 情况 下 ， 重 复 执 行 自动 化 测试 
用 例 集 两 次 ， 其 运行 结果 不 一 致 ， 例 如 有 一 些 测试 用 例 在 第 一 次 运行 时 结果 是 “成 功 ”， 
在 第 二 次 运行 时 的 结果 是 “失败 ”", 其 总 体 运行 稳定 性 只 有 80%。 在 这 种 情况 下 ,团队 是 无 
法 进行 持续 集成 实践 的 。 由 于 这 种 构建 结果 不 可 信 ， 如 果 支 持 使 用 六 步 提交 法 ， 那 么 会 浪 
费 很 多 时 间 。 

如 果 项 目 持续 时 间 较 长 ， 可 能 会 增加 更 多 的 自动 化 测试 。 此 时 就 要 求 团队 能 够 有 意识 
地 主动 优化 ， 才 能 不 断 收获 持续 集成 带 来 的 收益 。 优 化 的 内 容 包括 但 不 限于 以 下 几 项 。 

(1) 编译 打包 时 间 。 通 过 引入 各 种 工具 , 或 者 重新 组 织 和 优化 编译 找 包 脚本 ， 系 统 模 
块 拆 分 与 组 合 等 。 

(2) 代码 分 支 策 略 。 随 着 持续 集成 的 深入 ， 团 队 会 进一步 选择 利于 持续 集成 的 分 支 
策略 。 

(3) 自动 化 测试 用 例 的 分 层 分 级 。 随 着 自动 化 测试 用 例 的 种 类 及 数量 增多 ,需要 对 不 
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同类 型 的 自动 化 测试 用 例 进 行 分 层 分 级 管理 。 分 层 是 指 按 测 试 目标 分 层 ， 如 单元 测试 、 集 
成 测试 和 端 到 端的 测试 。 分 级 是 指 按 反馈 速度 和 反馈 质量 进行 分 级 ,在 资源 不 充裕 的 情况 
下 ， 将 各 种 测试 用 例 放 入 不 同 的 级 别 中 (如 提交 构建 任务 和 次 级 构建 任务 )， 并 按 线性 方 
式 顺序 执行 。 

(4) 测试 验证 环境 的 准备 。 有 时 测试 环境 的 准备 时 间 较 长 ， 耽 误 持续 集成 的 时 间 ， 我 
们 就 需要 将 测试 环境 的 准备 工作 进行 梳理 ， 减 少 人 工 参 与 ， 保 证 测试 环境 的 准备 时 间 。 如 
果 测 试用 例 较 多 ， 我 们 可 能 需要 同时 准备 多 套 测 试 环 境 ， 此 时 测试 环境 的 自动 化 准备 工作 
更 是 非常 重要 。 

(5) 优化 编码 规范 扫描 。 之 前 我 们 可 以 使 用 了 最 少量 的 编译 规范 。 随 着 实践 的 深入 ， 
困 队 可 以 逐步 增加 、 修 改 和 调整 编码 规范 ， 使 其 符合 团队 代码 质量 的 要 求 。 

(6) 生成 数据 报告 。 让 每 个 人 随时 都 能 够 方便 地 和 擎 担当 前 的 代码 质量 状态 。 

6. 工程 师 改变 习惯 ， 并 提升 技能 

持续 集成 是 一 个 积极 的 团队 协作 实践 ， 要 求 工 程 师 主动 提前 集成 ， 而 不 是 推迟 集成 。 
这 与 人 们 “推迟 风险 ”的 心理 相 违 背 ， 需 要 工程 师 改 变 工 作 习 惯 ， 将 大 块 任务 尽 可 能 拆 分 
成 细 粒 度 的 工作 。 同 时 ， 频繁 运行 的 自动 化 测试 套件 依赖 于 自动 化 测试 用 例 的 稳定 性 与 可 
靠 性 。 因 此 , 需要 工程 师 投入 一 些 时 间 来 学 习 相 关 的 方法 与 技巧 。 关 于 自动 化 测试 的 实施 
方式 与 编写 要 求 参见 第 10 章 。 


9.4.2 ”分支 策略 与 部 署 流水 线 


细心 的 读者 已 经 发 现 , 持续 集成 实践 中 的 提交 构建 和 次 级 构建 已 经 组 成 了 一 个 简单 的 
部 团 流 水 线 。 正 如 第 1 章 所 述 ， 最 早 提 出 部 署 流水 线 的 概念 时 ， 也 是 基于 持续 集成 实践 。 
但 是 ， 如 果 需 要 多 个 团队 协作 共同 开发 大 型 复杂 软件 (例如 手机 操作 系统 ) 时 ， 就 需要 仔 
细 设 计 团队 之 间 的 持续 集成 方式 。 

一 般 来 说 ,团队 间 的 持续 集成 方式 与 团队 所 采纳 的 代码 分 支 策略 密切 有 关 。 可 以 确定 
的 是 ， 每 创建 一 条 分 支 ， 都 应 该 立即 创建 与 其 对 应 的 部 署 流 水 线 ， 直 至 该 分 支 的 生命 周期 
结束 (被 弃 用 或 者 合并 回去 )。 

1.“ 主 干 开发 ， 主 干 发 布 ”策略 

如 果 软 件 产品 只 有 一 个 代码 仓库 ， 并 且 团 队 采 用 “主干 开发 ， 主 干 发 布 ”的 方式 ， 那 
么 ， 团 队 只 需要 对 该 代码 主干 做 持续 集成 。 也 就 是 说 ， 开 发 该 产品 的 团队 只 需要 架设 一 个 
持续 集成 服务 ， 关 注 代码 主干 的 代码 变更 即 可 。GoCD 团 队 在 产品 未 正式 发 布 以 前 ， 就 是 
采用 这 种 方式 做 持续 集成 ， 如 图 9-10 所 示 。 

2.“ 主 干 开发 ， 分 支 发 布 ”策略 

如 果 软 件 产品 只 有 一 个 代码 仓库 ， 并 且 团 队 采 用 “主干 开发 ， 分 支 发 布 ”的 方式 ， 那 
么 ,团队 每 当 准 备 发 布 时 应 该 创建 新 的 发 布 分 支 ， 并 为 这 个 发 布 分 支 创建 对 应 的 部 署 流水 
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线 ， 因 为 团队 成 员 会 在 该 分 支 上 修改 缺陷 ， 提 交代 码 ， 如 图 9-11 所 示 。 
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图 9-11 “主干 开发 ,分 支 发 布 ” 的 持续 集成 策略 


3.“ 分 支 开 发 ， 主 干 发 布 ”策略 

如 果 软 件 产品 只 有 一 个 代码 仓库 ， 并且 团 队 采 用 “分 支 开 发 ， 主 干 发 布 ” 的 方式 ， 那 
么 团队 需要 为 每 个 开发 分 支架 设 一 条 对 应 的 部 署 流水 线 , 并 且 每 当 有 分 支 向 主干 合 入 代码 
时 ， 立 即 触发 主干 对 应 的 部 署 流水 线 。 当 分 支 上 的 代码 提交 不 再 活跃 ， 或 者 分 支 直 接 被 删 
除 后 ， 其 对 应 的 部 署 流水 线 也 可 以 被 删除 ， 如 图 9-12 所 示 。 这 种 持续 集成 方式 多 见于 大 型 
复杂 软件 产品 的 “团队 分 支 ” 开 发 方式 。 

4.“ 多 组 件 集成 ”策略 

本 策略 是 指 软件 产品 由 多 个 服务 或 组 件 构成 ， 并 且 每 个 服务 〈 或 组 件 ) 有 独立 的 代码 
仓库 , 每 个 仓库 由 多 人 贡献 代码 。 此 时 , 每 个 独立 代码 仓库 可 能 都 有 自己 不 同 的 分 支 策 略 。 
此 时 ， 根 据 前 面 讲 述 的 3 种 不 同 策略 ， 为 每 个 独立 代码 仓库 建立 各 自 的 部 署 流水 线 。 然 后 ， 
再 创建 一 条 集成 用 的 部 署 流水 线 ， 该 流水 线 并 不 轮 询 任何 代码 仓库 ， 而 是 由 上 游 的 多 个 部 
署 流水 线 触发 。 一 旦 上 游 的 部 署 流水 线 成 功 完成 ， 这 条 负责 集成 的 流水 线 就 应 该 对 获取 上 
游 流 水 线 生 产 的 软件 包 进行 集成 构建 验证 。 
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图 9-12 “分 支 开 发 ， 主 干 发 布 ”的 持续 集成 策略 


例如 ， 每 个 组 件 都 使 用 “主干 开发 ， 主 干 发 布 ” 策 略 ， 那 么 ， 人 
上 略 如 图 9-13 所 示 ， 每 个 代码 主干 对 应 一 条 部 署 流水 线 ， 所 有 主干 部 署 流水 线 均 对 应 同一 
集成 部 署 流水 线 。 
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图 9-13 ”多 组 件 “ 主 干 开发 ， 主 干 发 布 ” 的 部 署 流水 线 集成 模式 


当然 ， 上 面 讲 述 的 4 种 持续 集成 模式 仅 是 最 基本 模式 ， 在 实际 软件 产品 生命 周期 中 ， 
根据 团队 规模 、 产 品 形态 、 组 件 化 程度 与 发 布 策略 的 不 同 ， 真实 的 部 署 流水 线 通 常 是 上 述 
4 种 模式 的 组 合 。 


9.5 “常见 的 实施 问题 


在 实施 持续 集成 实践 的 过 程 中 ,我们 通常 会 遇 到 很 多 困难 ， 而 这 其 中 有 一 部 分 来 自 团 
队 原 有 的 工作 习惯 (例如 ,开发 人 员 在 自己 的 开发 任务 完成 之 前 不 希望 ed 
集成 、 测 试 人 员 希 望 在 一 批 特性 开发 完成 之 后 再 集中 进行 测试 等 )， 还 有 一 部 分 是 由 于 技 
术 研 发 管理 的 缺乏 导致 的 ， 例 如 开发 、 测试 和 运 维 环境 没有 分 离 或 分 离 不 彻底 多 人 共用 
测试 环境 ， 各 类 调试 环境 的 准备 工作 很 复杂 等 。 我 们 在 本 章 中 只 讨论 下 面 3 个 关于 工作 习 




















9.5 常见 的 实施 问题 151 





惯 的 问题 ， 其 他 问题 在 后 续 章节 讨论 。 
9.5.1 工程 师 的 开发 习惯 


在 没有 进行 持续 集成 实践 之 前 , 很 多 公司 对 开发 工程 师 的 代码 提交 粒度 和 频率 并 没有 
太 多 要 求 , 尤其 是 使 用 传统 瀑布 开发 方法 的 组 织 。2009 年 , 我 在 某 通 信 公 司 做 咨询 时 发 现 ， 
在 两 个 月 的 开发 阶段 里 ,团队 成 员 将 SVN 代 码 仓库 仅仅 作为 一 个 防止 代码 丢失 的 仓库 , 每 
次 提交 之 后 是 否 能 够 编译 通过 也 没有 人 关注 。 一 些 工程 师 甚至 两 个 月 都 不 提交 代码 , 一 直 
将 代码 保存 在 自己 的 开发 工作 站 上 。 到 了 最 后 团队 集中 联 调 ， 甚 至 是 马上 要 进入 提 测 阶段 
时 ， 才 将 代码 提交 到 SVN 仓 库 中 。 

如 果 工 程 师 习惯 于 长 时 间 不 与 其 他 人 的 代码 进行 集成 , 则 在 刚刚 开始 使 用 持续 集成 实 
践 时 ， 很 难 立 即 达到 前 面 所 说 的 “持续 集成 最 佳 状态 ”"， 如 小 步 提交 、 代 码 完整 、 不 影响 
已 有 功能 等 。 但 是 ， 如 果 能 够 遵循 第 6 章 中 对 需求 拆 分 的 实践 ， 则 有 助 于 加 快 质量 反馈 速 
度 ， 达 成 展 好 的 持续 集成 效果 。 强 调 开发 质量 和 质量 打磨 周期 的 持续 缩短 是 影响 工程 师 习 
惯 的 入 手 点 。 


9.5.2 ”视而不见 的 扫描 问题 


持续 集成 的 一 个 重要 工作 就 是 “能 够 快速 验证 当前 构建 产物 的 质量 "。 通 常 我 们 会 有 
一 系列 的 手段 来 完成 这 一 质量 验证 ， 其 中 “打包 测试 ”(build verifaction test)、“ 代 码 规范 
扫描 ”和 “代码 动静 态 扫描 ”这 3 个 是 相对 投入 成 本 比较 低 、 执 行 成 本 不 高 ， 比 较 容易 实 
施 ， 各 团队 可 以 从 这 里 入 手 。 

但 是 ,值得 注意 的 是 ， 扫 描 的 结果 常会 被 工程 师 忽 视 。 其 原因 可 能 有 两 个 : 一 是 团队 
成 员 对 扫描 规则 没有 达成 一 致 ， 部 分 工程 师 对 其 中 的 问题 有 异议 , 但 这 种 异议 被 管理 者 所 
忽视 ， 二 是 扫描 出 来 的 问题 太 多 ， 无 从 下 手 修复 。 

第 一 个 问题 的 原因 是 团队 技术 管理 问题 ， 代 码 规范 没有 统一 标准 。 此 时 ， 首 先 应 该 由 
团队 技术 负责 人 与 团队 一 起 学 习 代码 规范 ， 讨 论 并 制订 团队 的 代码 标准 ， 并 记录 达成 一 致 
的 检查 项 ， 再 进行 自动 化 扫描 。 

第 二 个 问题 通常 发 生 在 产品 研发 进度 紧张 的 时 候 。 此 时 应 该 执行 “童子 军营 地 法 则 ”， 
即 保持 质量 指标 不 再 恶化 ， 例 如 ,“ 每 次 提交 代码 都 让 问题 数 减少 ， 至 少 不 能 增加 ”;， 或 者 
限期 整改 ， 如 “3 个 月 内 将 严重 问题 请 零 ”。 同 时 ， 也 可 以 开发 一 些 方便 易 用 的 工具 ， 工 程 
师 可 以 用 它 方便 地 发 现 相 关 的 编码 规范 问题 ， 并 及 时 修正 。 


9.5.3 自动 化 测试 用 例 的 缺乏 


测试 活动 是 目前 团队 最 重要 的 质量 保证 活动 之 一 , 而 由 测试 人 员 进 行 集中 性 手工 测试 
是 一 种 “ 慢 反 馈 ”， 也 就 是 说 ， 只 有 当代 码 功 能 开发 完成 ， 并 且 软 件 可 运行 之 后 ， 才 能 执 
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行 测试 用 例 ， 而 且 需 要 协调 开发 人 员 与 测试 人 员 的 工作 时 间 表 。 
假如 有 自动 化 测试 用 例 , 我 们 就 可 以 想 办 法 在 每 次 集成 构建 之 时 自动 执行 它 , 在 不 需 
要 其 他 人 的 帮助 下 ， 每 个 工程 师 自己 都 可 以 随时 执行 这 些 自动 化 测试 用 例 ， 那 就 更 棒 了 。 
目前 的 大 部 分 自动 化 测试 用 例 仍 旧 是 由 人 编写 的 代码 , 因此 需要 有 良好 编码 技能 的 工 
程 师 。 在 持续 集成 实践 中 ， 这 些 自动 化 测试 用 例 扮 演 着 重要 的 角色 ， 需 要 非常 稳定 且 正 确 
地 执行 ， 否 则 ， 其 反馈 的 结果 〈 如 随机 失败 ) 很 容易 产生 误导 ,浪费 工 程 师 的 宝贵 时 间 。 
关于 如 何 制订 测试 策略 ， 做 好 测试 管理 ， 以 及 如 何 编写 好 的 自动 化 测试 ， 我 们 将 在 第 
10 章 中 介绍 ， 本 章 不 再 展开 讨论 。 


9.6 小 结 


本 章 主要 讲述 了 持续 集成 的 起 源 ， 团 队 实 施 持 续集 成 的 原则 ， 介 绍 了 持续 集成 6 步 提 
交 法 ， 以 及 快速 建立 团队 持续 集成 实践 的 5 个 步骤 。 并 不 是 安装 部 署 了 一 个 持续 集成 服务 
器 ， 每 天 用 它 进 行 自动 化 编译 打包 ， 就 说 明 团 队 正 在 使 用 持续 集成 实践 。 要 真正 做 到 持续 
集成 ， 获 得 最 大 的 持续 集成 收益 ， 需 要 做 到 以 下 6 点 。 

(1) 主干 开发 ， 频 率 提 交代 码 。 

(2) 每 次 提交 都 是 完整 有 意义 的 工作 。 

(3) 提交 构建 阶段 在 10 分 钟 之 内 完成 。 

(4) 提交 构建 失败 后 ， 立 即 修复 ， 且 其 他 人 不 得 在 修复 之 前 提交 代码 。 
) 
) 












































(5) 应 该 在 10 分 钟 内 修复 失败 ， 否 则 回 滚 引 起 失败 的 代码 。 
(6) 自动 化 构建 成 功 后 ， 团 队 对 软件 质量 比较 有 信心 。 
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上 一 章 中 , 我 们 讨论 了 “持续 集成 ”的 定义 、 六 步 提 交 法 和 团队 持续 集成 模式 。 
士 要 起 发挥 持续 集成 的 真正 作用 ， 一 个 至 关 重 要 的 部 分 就 是 自动 化 测试 策略 。 
在 本 章 中 , 我 们 主要 讨论 软件 进入 生产 环境 之 前 的 自动 化 测试 管理 , 包括 自动 化 测试 
的 自身 定位 、 传 统 自 动 化 测试 的 困境 、 利 于 反馈 的 自动 化 测试 实施 策略 以 及 如 何 编 写 易 维 
护 的 自动 化 测试 用 例 。 


10.1 自动 化 测试 的 自身 定位 


一 般 来 说， 测试 领域 有 4 类 基本 活动 ， 它 们 分 别 是 问题 认 知 、 分 析 、 执 行 和 决策 。 其 
中 ,“ 问 题 认 知 ” 是 指 对 业务 问题 本 身 的 理解 和 认识 。 其 主要 信息 来 源 于 持续 交付 “8” 字 
环 中 的 探索 环 。 分 析 ” 是 指 “ 测 试 分 析 和 设计 ”， 通 过 对 业务 问题 的 认 知 ， 分 析 并 设计 能 
够 验证 是 否 成 功 解决 业务 问题 的 方式 和 方法 ， 通 过 不 断 优化 ， 在 确保 验证 质量 的 前 提 下 ， 
使 测试 成 本 最 低 。“ 执 行 ” 是 指 执 行 由 测试 分 析 环 市 产生 的 测试 用 例 ， 得 到 测试 结果 或 数 
据 。 而 “决策 ”是 指 根据 测试 结果 做 出 下 一 步行 动 判断 。 

在 这 4 类 活动 中 ， 只 有 “执行 ”环节 存在 大 量 重复 性 的 劳动 ， 其 中 很 多 都 可 以 由 机 器 
来 承担 ， 而 自动 化 测试 就 是 发 挥 机 器 的 优势 ， 将 人 从 重复 的 手工 劳动 中 解放 出 来 。 那 么 ， 
到 底 有 哪些 类 型 的 测试 可 以 被 自动 化 呢 ? 根据 Brian Marick 提 出 的 敏捷 测试 的 四 象限 分 类 
法 (如 图 10-1 所 示 )， 我 们 可 以 将 不 同类 型 的 测试 放 入 其 中 。“ 面 向 业务 专家 ”是 指 能 够 与 
业务 专家 无 障 得 沟通 ; “面向 技术 人 员 ” 是 指 容易 与 技术 人 员 达 成 共识 。 文 持 编程 ”是 指 
它 的 第 一 目标 是 为 了 帮助 产品 研发 团队 自己 检查 功能 需求 是 否 开发 完成 ;“ 评 判 项 目 ” 是 
指 用 于 找 出 产品 是 否 有 缺陷 。 

第 二 、 三 象限 中 的 测试 类 型 都 可 以 被 自动 化 ， 包 括 功能 验收 测试 、 单 元 测试 、 组 件 测 
试 和 系统 集成 测试 。 其 中 ， 功 能 验收 测试 是 从 用 户 的 角度 来 验收 软件 功能 ， 而 单元 测试 、 
组 织 测试 和 系统 集成 测试 都 是 软件 研发 团队 对 于 自我 软件 技术 实现 的 验证 。 第 四 象限 中 的 
非 功 能 验收 测试 (包括 安全 测试 、 性 能 测试 等 中， 有 一 部 分 可 以 被 完全 自动 化 ， 但 大 多 
数 都 至 少 可 以 半自动 化 。 第 一 象限 中 的 测试 类 型 通常 都 只 能 通过 手工 方式 运行 ， 例 如 软件 
演示 、 用 户 体验 测试 和 探索 性 测试 。 本 章 主要 讨论 第 二 象限 和 第 三 象限 中 的 测试 类 型 。 
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面向 业务 专家 
自动 化 手工 
用 户 演示 
用 户 功能 验收 测试 可 用 性 测试 
探索 性 测试 
支 
持 
纺 
程 系统 集成 测试 非 功能 验收 测试 
组 件 测试 (性 能 测试 、 容 量 测试 、 
单元 测试 可 靠 性 测试 等 ) 
自动 化 自动 化 /手工 
面向 技术 人 员 
10-1 Brian Marick 测 试 四 象限 
10.1.1 自动 化 测试 的 优势 


与 手工 测试 相 比 ， 自 动 化 测试 在 以 下 方面 有 较 大 的 优势 。 


减少 失误 率 ， 提 高 准确 性 。 自 动 化 测试 每 次 执行 时 都 会 执行 相同 的 步骤 ， 并 且 每 
次 都 会 记录 详细 的 执行 结果 ， 且 不 受 “ 人 ”的 因素 影响 % 而 人 在 执行 重复 性 工作 
时 ， 由 于 个 人 经 验 和 当时 的 个 人 情绪 不 同 ， 很 可 能 会 对 执行 结果 产生 不 同 的 影响 。 
节省 时 间 和 执行 成 本 。 在 软件 的 整个 生命 周期 中 7 测试 活动 需要 经 常 重复 ， 以 确 
保质 量 。 当 每 次 源 代码 被 修改 时 ， 软 件 济 试 都 应 该 重复 进行 。 而 在 每 次 软件 新 版 
本 的 发 布 之 前 ， 都 要 在 所 有 支持 的 操作 系统 和 硬件 配置 上 进行 测试 。 自 动 化 测试 
用 例 一 旦 被 创建 ， 就 可 以 做 到 无 人 值守 地 运行 ， 它 们 其 至 可 以 在 不 同 配置 的 多 台 
电脑 上 并 行 运行 ， 而 且 可 能 比 手动 测试 快 。 自 动 化 的 软件 测试 可 以 将 重复 的 手工 
测试 的 时 间 从 几 天 缩短 到 几 小 时 。 尤 其 是 在 软件 生命 周期 较 长 且 发 布 频率 较 高 的 
情况 下 ， 时 间 成 本 的 节省 非常 明显 。 

提升 测试 覆盖 度 。 自 动 化 测试 可 以 增加 测试 的 深度 和 范围 ， 以 帮助 提高 软件 质量 。 
例如 ， 自 动 化 测试 可 以 查看 应 用 程序 内 部 的 运行 情况 ， 如 内 存 使 用 、 内 存 中 的 内 
容 及 数据 表 、 文 件 内 容 和 内 部 程序 状态 ， 以 确定 产品 是 否 按 预期 运行 。 自 动 化 测 
试 可 以 在 每 次 测试 运行 中 轻松 执行 数 千 个 不 同 的 复杂 测试 用 例 ， 从 而 提供 手动 测 
试 所 不 及 的 覆盖 范围 。 
做 手工 无 法 完成 的 测试 。 即 使 是 最 大 的 软件 质量 保证 部 门 ， 也 无 法 手工 模拟 成 千 
上 万 的 用 户 同 时 受 控 的 网 络 应 用 测试 。 而 自动 化 测试 却 可 以 模拟 数 千 个 虚拟 用 户 ， 
与 网 络 、 软 件 和 Web 应 用 程序 进行 交互 。 

为 开发 人 员 提 高 质量 反馈 速度 。 在 将 软件 提交 到 质量 检查 部 门 进行 验证 之 前 ， 开 
发 人 员 就 可 以 使 用 这 些 共享 的 自动 化 测试 ， 快 速 发 现 问 题 。 无 论 何 时 检 入 源 代码 
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更 改 ， 测 试 都 可 以 自动 运行 ， 并 通知 团队 或 开发 人 员 是 否 失 败 。 这 会 大 量 市 省 开 
发 人 员 的 时 间 ， 同 时 也 增加 他 们 对 自己 编写 的 软件 代码 质量 的 信心 。 

。 提高 团队 士气 。 尽 管 士气 很 难 衡 量 ， 但 可 以 感受 到 。 使 用 自动 化 测试 执行 重复 性 任 
务 ， 可 以 让 团队 将 时 间 花 在 更 具 挑 战 性 和 更 有 价值 的 活动 中 ， 如 探索 性 测试 。 团 队 
成 员 可 以 提高 自己 的 技能 和 信心 ， 同 时 技能 与 信心 的 提升 也 回馈 给 他 们 的 团队 。 


10.1.2 自动 化 测试 所 需 的 投入 


事物 都 具有 两 面 性 。 自 动 化 测试 带 来 收益 的 同时 ， 也 会 产生 成 本 ， 同 时 也 无 法 覆盖 。 
其 成 本 包括 以 下 几 方面 。 
e 工具 投入 成 本 。 由 于 自动 化 测试 需要 工具 支持 ， 因 此 需要 进行 相关 测试 工具 的 研 
发 投入 。 同 时 ， 还 需要 对 团队 成 员 进行 专 有 测试 架构 和 工具 的 使 用 培训 。 
。 用 例 维护 成 本 。 软 件 在 其 整个 生命 周期 中 ， 通 常 都 会 不 断 地 进行 功能 的 添加 、 删 
除 和 修改 。 此 时 ， 原 有 的 自动 化 测试 用 例 代码 也 需要 进行 相应 的 改动 ， 带 来 一 定 
的 修改 成 本 。 
e 专业 技能 人 员 的 成 本 。 创 建 自动 化 测试 用 例 ， 必 然 要 编写 代码 。 要 求 自动 化 测试 
用 例 的 创建 者 掌握 软件 设计 与 代码 编写 能 力 。 
。 设备 资源 的 投入 。 由 于 自动 化 测试 无 法 完全 代替 手工 测试 ， 因 此 ， 我 们 不 但 需要 
保留 手工 测试 所 需要 的 测试 环境 ， 同 时 还 要 为 自动 化 测试 用 例 的 执行 准备 相应 的 
测试 环境 。 
与 手工 测试 相 比 ， 其 不 足 在 于 “无 法 观察 执行 过 程 ”。 自 动 化 测试 用 例 在 执行 时 ， 只 
做 执行 脚本 要 求 它 做 的 事情 ， 并 没有 任何 主动 观察 、 认 知 和 分 析 能 
因此 ， 自 动 化 测试 用 例 最 擅长 回答 的 问题 是 “软件 系统 是 否 按照 我 们 预先 设计 的 方式 
正确 运行 了 ?”， 而 这 里 的 “预先 设计 ”也 是 由 工程 师 编写 代码 完成 检查 条 件 的 设 定 的 。 
因此 , 自动 化 测试 主要 用 于 软件 功能 的 批量 回归 验证 , 是 一 种 机 械 式 且 重复 性 的 验证 工作 ， 
而 这 正 是 机 器 所 擅长 的 。 相 反 ， 手 工 测 试 的 最 核心 价值 在 于 回答 “我 们 是 否 正在 开发 一 个 
正确 的 、 满 足 用 户 期 望 的 软件 系统 ?”， 因 为 在 手工 测试 过 程 中 ， 我 们 可 以 主动 观察 、 学 
习 和 分 析 ， 进 行 更 具有 创造 性 的 工作 ， 例 如 探索 测试 、 用 户 友 好 性 验证 或 者 用 户 体验 的 改 
善 。 这 种 类 型 的 工作 是 机 器 不 擅长 的 ， 目 前 也 无 法 由 机 器 来 做 。 

假如 一 款 软件 仅 需要 一 次 执行 质量 验证 工作 , 那么 , 此 时 一 定 是 手工 测试 的 收益 最 大 ， 
因为 它 完全 发 挥 不 了 自动 化 测试 的 优势 。 然 而 ， 在 现实 情况 下 ， 这 个 假设 基本 上 是 不 成 立 
的 。 我 们 总 是 需要 做 回归 测试 工作 ,而 且 随 着 交付 周期 的 缩短 ， 回 归 测 试 工作 的 频率 也 在 
不 断 增加 。 如 果 我 们 依赖 自动 化 测试 ， 则 自动 化 测试 的 执行 次 数 增加 ,会 使 其 投入 产 出 比 
也 增高 ， 如 图 10-2 所 示 。 两 条 曲线 的 交点 到 底 在 哪里 , 取决 于 多 种 因素 ， 如 平均 人 力 成 本 、 
时 间 成 本 、 设 备 成 本 、 调 试 执行 的 频率 以 及 产品 生存 周期 等 。 






















































































156 第 10 章 ”自动 化 测试 策略 与 方法 





手工 方式 自动 化 方式 
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图 10-2 “自动 化 测试 与 手工 测试 的 成 本 收益 对 比 示意 图 
10.2 ”突破 传统 自动 化 测试 的 困境 


自动 化 测试 本 身 并 不 是 一 个 新 事物 。 自 从 软件 诞生 以 来 , 很 多 软件 团队 都 会 为 了 消除 
手工 重复 劳动 而 投入 对 测试 用 例 的 自动 化 活动 。 这 些 测试 用 例 主要 集中 于 覆盖 软件 的 最 基 
本 功能 ， 由 测试 部 门 负责 编号、 维护 和 使 用 。 一 个 常见 的 用 途 是 作为 提 测 前 的 一 个 自动 化 
检验 标准 ， 也 就 是 说 ， 当 开发 部 门 完成 开发 以 后 ， 在 提交 给 测试 部 门 进行 手工 测试 之 前 ， 
必须 运行 这 些 自 动 化 回归 测试 用 例 ， 并 达到 测试 通过 的 标准 ,而 这 些 自动 化 测试 用 例 的 创 
建 流程 通常 如 图 10-3 所 示 。 
测试 用 例 
设计 者 


设计 测试 用 例 ， 
并 文档 化 


























测试 自动 化 
开发 工程 师 
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基本 测试 用 例 


1 
1 
1 
1 
1 
本 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 





编写 测试 用 例 
的 自动 化 脚本 


10-3 ”传统 自动 化 测试 用 例 的 生产 流程 


。 第 一 步 : 测试 分 析 者 设计 测试 用 例 ， 并 文档 化 。 

。 第 二 步 : 测试 执行 者 执行 测试 用 例 ， 并 报告 bug。 

。 第 三 步 : 开发 人 员 修复 bug。 

。 第 四 步 : 测试 执行 者 再 次 执行 测试 ， 直 至 验证 通过 。 

。 第 五 步 : 测试 自动 化 专家 从 测试 用 例文 档 中 选 出 一 些 重要 且 变 动 可 能 性 较 小 的 测 
试用 例 。 
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。 第 六 步 : 对 挑选 出 来 的 重要 测试 用 例 编写 自动 化 脚本 ， 并 归 入 自动 化 回归 测试 用 
例 库 。 


10.2.1 传统 自动 化 测试 的 特点 


这 种 流程 产生 的 自动 化 回归 测试 用 例 通常 有 以 下 6 个 特征 。 

(1) 测试 用 例 执行 成 本 高 。 多 为 黑 盒 自 动 化 测试 用 例 , 而 且 通 常 是 以 模拟 界面 操作 来 
驱动 的 系统 集成 测 坛 。 这 种 测试 用 例 需 要 模拟 真实 用 户 的 界面 操作 ， 同 时 要 在 界面 捕获 系 
统 返 回 的 结果 。 除 启动 被 测 系统 时 所 需 的 初始 数据 以 外 ， 每 个 用 例 运 行 前 都 要 为 其 准备 数 
据 ， 运 行 结果 后 要 清理 脏 数 据 。 而 因为 处 理 流程 较 长 ， 需 要 为 每 个 用 例 准 备 的 数据 较 多 ， 
因此 花费 时 间 和 精力 较 多 。 

(2) 自动 化 测试 执行 频率 低 。 自 动 化 测试 用 例 通常 只 在 软件 开发 完成 之 后 ， 作 为 进入 
测试 阶段 的 准 入 标准 ， 以 及 系统 回归 测试 时 使 用 。 

(3) 质量 反馈 滞后 。 大 部 分 测试 用 例 是 对 软件 应 用 主要 操作 流程 的 回归 用 例 ， 无 法 覆 
盖 当 前 版 本 正在 开发 的 新 功能 。 另 外 ， 在 用 例 运行 过 程 中 ， 为 了 能 够 安全 和 运行， 经 常会 通 
过 类 似 Sleep 这 样 的 指令 , 令 流 程 暂停 ,以 等 待 系统 处 理 完毕 ， 再 继续 下 面 的 操作 流程 。 因 
此 ， 非 常 消耗 时 间 。 

(4) 测试 环境 准备 成 本 高 。 由 于 这 些 自动 化 测试 用 例 通 常 都 是 端 到 端的 自动 化 测试 用 
例 ， 因 此 需要 准备 完善 的 测试 数据 集 和 整套 的 运行 环境 。 测 试 环境 的 搭建 过 程 中 手工 操作 
比较 多 ， 甚 至 需要 多 人 参与 ， 成 本 较 高 。 

(5) 测试 结果 可 信和 度 低 。 受 机 器 硬件 配置 、 网 络 状 况 、 用 例 的 处 理 流程 长 度 等 多 种 因 
素 影响 , 端 到 端的 自动 化 测试 用 例 可 能 会 随机 失败 , 也 就 是 说 , 在 一 切 条 件 不 变 的 情况 下 ， 
多 次 运行 同一 个 自动 化 测试 用 例 ， 运 行 结果 不 同 ， 有 了 时 成 功 ， 有 了 时 失败 。 正 是 由 于 这 种 自 
动 化 测试 用 例 自身 的 不 稳定 性 ， 令 测试 结果 的 可 信 度 大 大 降低 。 另 外 ， 大 型 团队 协作 也 会 
给 端 到 端 测试 带 来 困难 。 例 如 ， 界 面 需求 的 改动 未 能 及 时 通知 测试 团队 ， 导 致 没有 及 时 更 
新 原 有 的 自动 化 测试 用 例 ， 最 终 导致 与 改动 相关 的 测试 用 例 因 未 及 时 更 新 而 运行 失败 。 以 
上 这 些 因素 会 促使 软件 研发 团队 更 倾向 于 忽略 这 些 自动 化 测试 用 例 的 存在 。 

(6) 人 员 依 赖 性 强 。 编 写 自动 化 测试 用 例 很 大 程度 上 依赖 于 少数 测试 开发 专职 人 员 。 

这 类 自动 化 测试 用 例 编 写 和 执行 方式 适合 于 版 本 发 布 周期 较 长 、 使 用 传统 瀑布 开发 方 
法 的 团队 。 随 着 软件 需求 多 变性 的 增加 、 软 件 功能 复杂 性 的 不 断 提高 以 及 人 机 交互 要 求 的 
提高 ， 软 件 版 本 迭代 速度 越 来 越 快 ， 这 种 自动 化 测试 用 例 的 投资 回报 率 越 来 越 低 。 


10.2.2 自动 化 测试 的 分 层 


将 图 10-1 中 第 二 象限 和 第 三 象限 的 自动 化 测试 类 型 按照 其 所 履 盖 的 被 测 对 象 范围 自 
大 向 小 进行 分 层 ， 如 图 10-4a 所 示 , 我 们 会 发 现 , 传统 自动 化 测试 方式 产生 的 测试 用 例 类 型 
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多 为 用 户 验收 测试 和 系统 集成 测试 ， 其 测试 用 例 的 被 测 对 象 范围 也 较 大 ， 单 个 测试 用 例 运 
行 时 间 也 较 长 。 同 时 ， 用 例 数 量 也 较 多 。 而 由 于 开发 人 员 通 常 不 参与 自动 化 测试 的 建设 ， 
因此 下 面 两 层 的 自动 化 测试 数量 较 少 , 从 而 形成 了 “ 头 重 脚 轻 ” 的 情况 , 被 形象 地 称 为 “ 容 
易 融 化 的 测试 蛋 简 冰淇淋 ”， 如 图 10-4b 所 示 。 








被 测 
范围 
大 
用 户 验收 测试 整个 软件 应 用 
。 支撑 软件 运行 的 
系统 集成 测试 一 个 (或 多 个 ) 子 系统 
组 件 测试 某 个 子 系统 的 内 部 组 件 
单元 测试 单个 组 件 的 内 部 单元 小 





(a) 





图 10-4 ”测试 类 别 与 被 测 对 象 殉 围 的 对 应 关系 


这 种 “ 蛋 简 冰淇淋 ”模式 不 利于 持续 集成 。 在 第 9 章 中 有 我们 要 求 在 提交 代码 前 后 都 
要 执行 自动 化 测试 用 例 ， 并 且 强 调 自动 化 测试 要 对 被 测 软件 提供 快速 且 高 质量 的 验证 反 
馈 。 因 此 ,“ 快 、 捷 、 时 、 信 ”成 为 持续 集成 实践 对 自动 化 测试 建设 的 4 个 基本 衡量 维度 。 

(1) 快速 “快速” 是 指 自动 化 测试 用 例 的 执行 速度 要 快 。 假 如 一 组 自动 化 测试 用 例 
需要 30 分 钟 才 能 执行 完成 ,那么 它 能 提供 的 质量 反馈 周期 就 一 定 会 超过 30 分 钟 。 因 为 还 至 
少 需 要 编译 、 打 包 、 部 署 操 作 。 对 那些 编写 大 量 端 到 端 自动 化 测试 用 例 的 团队 来 说 ，30 分 
钟 是 远 远 不 够 的 ， 但 是 持续 集成 的 要 求 却 是 “最 好 在 10 分 钟 之 内 ， 不 要 超过 15 分 钟 ”。 

(2) 便捷 。“ 便 捷 ” 是 指 团队 中 的 每 名 工程 师 都 能 够 随时 随地 很 方便 地 执行 自动 化 测 
试用 例 ， 而 且 不 需要 他 人 帮助 ， 也 不 会 影响 到 他 人 。 如 果 无 法 做 到 “便捷 ”， 人 们 就 会 倾 
向 于 “推迟 反馈 ”， 直 至 其 认为 执行 一 次 自动 化 测试 用 例 的 收益 足以 抵 销 “测试 准备 工作 ” 
的 成 本 。 

(3) 及 时 。“ 及 时 ”是 指 一 旦 功能 发 生 了 改变 ， 就 能 够 通过 自动 化 测试 用 例 的 运行 ， 
告知 本 次 代码 变更 对 软件 质量 的 影响 , 包括 对 原 有 功能 的 影响 , 以 及 新 增 功能 的 质量 情况 。 
如 果 工 程 师 已 开发 完成 新 功能 , 但 没有 自动 化 测试 用 例 及 时 验证 新 功能 和 这 次 改动 对 其 他 
功能 的 影响 ， 就 可 能 会 导致 反馈 速度 的 降低 。 

(4) 可 信 。 “可 信 ” 是 指 自动 化 测试 用 例 运 行 后 的 结果 可 以 信赖 , 不 存在 随机 失败 (或 
成 功 ) 的 现象 。 这 种 随机 失败 现象 是 由 于 测试 用 例 运 行 不 稳定 所 致 。 持 续集 成 实践 要 求 一 
且 自 动 化 测试 用 例 失 败 ， 必 须 立 即 修复 。 这 种 随机 失败 现象 会 大 大 增加 工程 师 的 “无 效 投 
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入 ”， 也 会 令 工 程 师 对 持续 集成 的 结果 失去 信心 ， 从 而 导致 他 们 对 真正 失败 的 测试 用 例 视 
而 不 见 ， 这 就 会 失去 持续 集成 的 重要 意义 。 

传统 自动 化 测试 的 生产 和 执行 方式 很 难 满 足以 上 4 个 基本 要 求 。 为 了 达到 “快速 ”和 
“可 信 ”， 就 必须 改变 自动 化 测试 用 例 在 不 同 层次 中 的 测试 数量 。 正 如 Mike Cohn 在 《Scrum 
敏捷 软件 开发 》 一 书 指出 ， 针 对 被 测 对 象 范 围 较 大 的 上 层 测 试用 例 ， 数 量 应 该 越 少 ， 而 被 
济 对 象 粒 度 较 细 的 下 层 测 试用 例 数量 应 该 增加 ， 形 成 稳定 的 正三 角形 ， 如 图 10-5 所 示 。 

下 层 测 试用 例 的 成 本 (包含 代码 维护 成 本 、 测 试 准备 成 本 和 执行 时 间 成 本 ) 低 于 上 层 
测试 用 例 , 例如 , 在 某 J2EE Web 软 件 应 用 项 目 中 , 其 各 层 自 动 化 测试 用 例 数 量 分 布 如 图 10-6 
所 示 , 下 层 的 单元 测试 数量 远 远 多 于 上 层 的 系统 集成 测试 和 用 户 验收 测试 的 数量 , 但 其 运 
行 时 间 却 非常 短 。 因 此 ， 我 们 应 该 鼓励 使 用 下 层 测 试用 例 来 验证 功能 逻辑 ， 这 样 更 容易 满 
足 持续 集成 对 自动 化 测试 的 4 个 基本 要 求 ， 从 而 形成 恨 性 的 工作 循环 。 针 对 某 一 软件 应 用 
或 服务 ， 并 不 是 所 有 层次 的 测试 都 必须 齐备 ， 而 是 要 根据 软件 应 用 本 身 的 特点 、 软 件 交 付 
的 要 求 以 及 团队 能 力 来 选择 。 而 且 ， 下 层 测试 用 例 不 可 能 完全 取代 上 层 测 试用 例 。 但 是 ， 
假如 可 以 选择 〈 如 那些 下 层 测 试用 例 可 以 覆盖 的 逻辑 与 场景 )， 为 了 提高 测试 运行 的 速度 
和 降低 成 本 ， 应 该 尽 可 能 使 用 下 层 测试 用 例 。 




















图 10-5 Mike Cohn 提 出 的 测试 金字 塔 10-6” 某 J2EE 软 件 应 用 的 自动 化 测试 数量 与 运行 时 间 





谷歌 公司 的 自动 化 测试 金字 塔 
谷歌 公司 的 软件 产品 开发 过 程 严重 依赖 于 自动 化 测试 用 例 。 每 次 代码 提交 前 ,都 会 
自动 运行 很 多 自动 化 测试 用 例 。 如果 自 动 化 测试 用 例 没 有 通过 ， 则 通常 无 法 进入 流程 的 
下 一 个 环节 ， 即 “代码 评审 ”。 而 且 ， 谷 歌 公 司 对 自动 化 测试 用 例 也 有 其 内 部 的 “金字 
塔 ” 划 分 方法 ， 也 就 是 说 ， 自 动 化 测试 用 例 被 分 为 3 种 类 型 ， 分 别 是 大 型 (large )、 中 型 
(medium ) 和 小 型 (small )， 如 图 10-7 所 示 。 
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图 10-7 谷歌 公司 测试 金字 塔 





这 3 种 类 型 自动 化 测试 的 具体 区 别 如 表 10-1 所 示 。 


























表 10-1 谷歌 公司 自动 化 测试 的 分 类 方法 与 定义 
测试 用 例 中 是 否 会 使 用 小 型 测试 中 型 测试 大 型 测试 
网 络 访问 否 仅 访 问 localhost 是 
数据 库 访问 向 是 是 
文件 访问 雷 是 是 
使 用 外 部 服务 桨 不 鼓励 是 
多 线程 否 是 是 
使 用 Sleep 语句 否 是 是 
使 用 系统 属性 设置 否 是 是 
运行 时 间 限 制 (毫秒 ) 60 300 900+ 














当然 , 这 在 谷歌 公司 内 部 并 不 是 一 个 测试 用 例 数量 上 的 强制 性 分 布 标准 , 而 是 一 个 
指导 性 建议 。 谷 歌 公 司 的 产品 线 较 多 ， 针 对 不 同 的 产品 ， 测 试 数量 的 比例 也 会 不 同 。 


10.2.3 不 同类 型 的 测试 金字 塔 

随 着 技术 飞速 发 展 ,互联 网 用 户 大 幅 上 升 。 为 了 能 够 应 对 互联 网 用 户 和 网 络 请 求 数 的 
指数 级 增长 ， 互 联网 企业 开始 将 其 软件 架构 向 服务 化 和 微服 务 方向 过 渡 ， 掀 起 了 大 规模 分 
布 式 应 用 服务 浪潮 。 很 多 后 台 软 件 服务 也 逐渐 开始 由 巨石 应 用 架构 被 拆 分 成 面向 服务 的 架 
构 (SOA)， 服 务 与 服务 之 间 通 过 RPC (Remote Procedure Call， 远 程 过 程 调用 ) 等 方式 进 
行 交 互 。 

2011 年 以 后 ,各 类 移动 设备 快速 崛起 ， 移 动 互 联网 用 户 飞速 增长 ， 移 动 互联 网 企业 数 
量 呈 现 爆 发 性 增长 ， 而 企业 与 企业 之 间 通 过 服务 接口 方式 进行 信息 交换 的 需求 也 非常 大 。 
面向 服务 架构 进一步 发 展 ， 慢 慢 出 现 了 微服 务 架 构 。 后 台 服 务 化 模块 被 拆 分 成 很 多 的 微服 
务 。 同 时 ， 客 户 端 软件 则 向 组 件 化 或 微 核 架 构 发 展 ， 如 图 10-8 所 示 。 关 于 巨石 应 用 架构 、 
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微 核 架构 微服 务 架构 
图 10-8 微 核 架构 与 微服 务 架构 示意 图 


1， 微 核 架 构 的 测试 金字 塔 














微 核 架 构 的 测试 金字 塔 如 图 10-9 所 示 。 最 顶层 的 端 到 端 自 动 化 测试 是 指 通过 模拟 界面 
操作 来 驱动 的 自动 化 测试 , API 自 动 化 测试 指 在 UI 层 之 下 , 通过 API 接 口 来 驱动 下 层 业 务 逻 
辑 的 自动 化 测试 ， 组件 或 插件 间 服 务 的 接口 自动 化 测试 主要 是 验证 两 个 或 两 个 以 上 组 件 
(插件 ) 间 的 功能 正确 性 ， 组件 测 试 是 对 单个 组 件 或 框架 本 身 进行 质量 验证 ， 自 动 化 单元 
测试 则 是 最 细 粒 度 的 自动 化 测试 。 





框架 组 件 与 插件 间 
服务 /接口 自动 化 测试 







框架 或 插件 的 自动 化 测试 


自动 化 单元 测试 











图 10-9 ” 微 核 架 构 的 测试 金字 塔 


2. 微服 务 应 用 的 测试 金字 塔 

图 10-10 给 出 的 是 微服 务 应 用 架构 的 测试 金字 塔 。 ead 
可 测 业务 逻辑 单元 进行 检查 和 验证 。 单 元 就 是 人 为 规定 的 最 小 被 测 业 务 逻辑 功能 模块 ,一 
般 会 根据 实际 情况 判断 “一 个 业务 逻辑 单元 ”所 指 的 具体 含义 。 例 如 ， 在 C 语 言 中 ， 单 元 
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可 能 是 指 一 个 函数 (如 一 个 加 密 算 法 )。 像 Java 这 类 面向 对 象 的 语言 中 , 单元 也 可 以 是 一 个 
Class (如 RequestDispatcher)。 其 特点 是 对 外 部 依赖 (如 文件 系统 、 网 络 等 ) 比较 少 ,测试 
运行 时 不 需要 系统 处 于 运行 状态 ， 而 且 测 试 运行 速度 快 。 业 务 单元 测试 与 原始 的 单元 测试 
相 比 ， 更 加 强调 业务 逻辑 单元 ， 而 非 代码 功能 。 









工作 流 测试 


契约 测试 


业务 服务 或 组 件 测试 


单元 测试 





图 10-10 ”微服 务 架构 的 测试 金字 塔 


(1) 业务 组 件 或 服务 测试 ， 是 指 对 单个 组 件 或 服务 的 测试 ， 以 验证 该 组 件 的 行为 是 否 
符合 设计 预期 。 组 件 是 由 多 个 最 小 业务 逻辑 单元 组 成 的 代码 块 ， 对 外 提供 一 组 相关 业务 功 
能 的 集合 。 它 既 可 能 与 本 系统 内 的 其 他 组 件 交 互 ， 也 可 能 负责 与 外 部 集成 点 进行 交互 (外 
部 集成 点 既 可 以 是 与 外 部 系统 交互 的 接口 ， 也 可 以 指 其 他 团队 正在 开发 的 组 件 )。 例 如 ， 
持续 集成 工具 GoCD 中 的 类 MaterialService 就 是 负责 与 Git 或 者 Subversion 打 交道 的 一 个 组 
件 。 组 件 测试 通常 也 不 需要 应 用 系统 处 于 运行 状态 , 但 有 可 能 涉及 外 部 依赖 (如 文件 系统 、 
网 络 、 数 据 库 等 )， 因 此 测试 用 例 的 运行 速度 可 能 会 比 单元 测试 稍 慢 。 

(2) 契约 测试 ， 又 称 为 消费 者 驱动 的 契约 测试 (consumer driven contracts test) 。 契 约 是 
间 软 件 系统 中 各 个 服务 间 交 互 的 数据 标准 格式 , 更 多 的 指 消费 者 与 服务 提供 方 之 间 交 互 的 数 
据 接口 的 格式 ， 如 图 10-11 所 示 。 其 目标 是 测试 消费 者 接口 与 服务 者 接口 之 间 的 正确 性 ， 验 
证 服务 者 提供 的 数据 是 否 为 消费 者 所 需要 的 ， 从 而 将 测试 范围 缩小 到 两 个 服务 之 间 的 契约 ， 
以 更 低 的 成 本 更 早 地 发 现 问 题 ， 更 快速 地 验证 消费 者 和 服务 提供 者 之 间 交 互 的 基本 正确 性 。 

(3) 业务 工作 流 测试 ， 是 指 启动 运行 两 个 或 以 上 微服 务 ， 进 行业 务 流程 上 的 测试 ， 以 
验证 多 个 被 测 服 务 之 间 是 否 可 以 正常 工作 , 完成 某 一 业务 请 求 。 关注 的 是 多 服务 组 合 交互 、 
测试 接口 连通 性 和 流程 的 可 用 性 。 例 如 ， 如 图 10-8 中 所 示 ， 对 于 服务 B、C 和 F 的 测试 就 是 
服务 之 间 的 工作 流 测 试 。 对 B 的 输入 是 m， 那 么 经 过 B、C 和 F 的 处 理 ， 输 出 应 该 是 n。 
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消费 者 契约 V1.0 服务 提供 者 











图 10-11 服务 间 的 契约 


(4) 端 到 端 测试 ， 指 对 整个 软件 服务 的 流程 进行 测试 ， 以 验证 其 工作 流 自始至终 的 执 
行 是 否 符合 设计 预期 。 进 行 端 到 端 测 试 的 目的 是 识别 系统 依赖 关系 , 并 确保 在 各 种 系统 ( 包 
括 外 部 依赖 以 及 多 个 内 部 系统 ) 之 间 传 递 正确 的 信息 。 一 种 常见 的 端 到 端 测试 是 模拟 用 户 
在 可 视 化 用 户 界面 上 执行 各 种 操作 。 如 果 软 件 服务 还 对 外 提供 非 可 视界 面 的 服务 (如 API 
调用 ， 甚 至 通过 文件 或 数据 库 进行 信息 交换 )， 那 么 ， 这 类 测试 也 归属 于 端 到 端的 测试 。 
它 从 用 户 的 角度 验证 整个 功能 的 准确 性 和 可 用 性 ， 测试 的 是 端 到 端的 业务 流程 ， 并 不 会 关 
注 某 一 细小 功能 点 的 实现 。 


10.3 自动 化 测试 的 实施 策略 


自动 化 测试 是 一 种 软件 开发 实践 , 也 不 是 一 种 新 鲜 事 物 。 在 没有 任何 测试 辅助 框架 时 ， 
很 多 优秀 的 开发 者 就 会 为 自己 写 的 代码 编写 自动 化 测试 ， 例 如 ， 在 C/C++ 工 程 中 ， 就 有 一 
种 非常 古老 的 做 法 ， 也 就 是 ， 在 每 个 C/C++ 文件 中 都 添加 一 个 Main 函 数 ， 用 来 验证 该 文件 
中 的 一 些 函 数 实现 。 现 在 ,每 种 开发 语言 都 有 对 应 的 自动 化 测试 框架 ， 常 常 不 只 一 种 。 

如 前 所 述 ， 自 动 化 测试 用 例 也 不 是 免费 的 , 需要 花费 一 定 的 成 本 ,而 每 个 公司 都 会 考 
虑 投资 回报 率 。 因此 , 我 们 需要 更 聪明 地 启动 自动 化 测试 实践 , 尤其 是 面 对 遗 留 系统 之 时 。 


10.3.1 增加 自动 化 测试 用 例 的 着 手 点 


针对 一 个 遗留 系统 ， 开 始 启 动 自动 化 测试 实践 ， 要 从 哪里 入 手 呢 ?” 除 牢记 要 避免 “ 蛋 
简 冰 淇 淋 ” 式 的 测试 用 例 分 布 以 外 ， 还 可 以 从 以 下 4 个 方面 人手 。 

1. 针对 代码 热 区 补充 自动 化 测试 用 例 

代码 热 区 是 指 那 些 代码 改动 频率 相对 较 高 的 文件 或 函数 ， 以 及 经 常 出 问题 的 功能 组 
件 。 对 那些 不 经 常 改动 又 长 期 运行 的 代码 来 说 ， 事 实 已 经 证 明 它们 运行 稳定 ， 因 此 也 不 必 
马上 为 它们 写 自动 化 测试 用 例 。 只 有 为 代码 热 区 写 自动 化 测试 , 才 是 投入 产 出 比 最 划算 的 。 

2. 跟随 新 功能 开发 的 进度 

最 好 能 跟随 开发 进度 , 编写 对 应 的 自动 化 测试 用 例 。 因 为 这 些 自动 化 测试 用例 可 以 直 
接应 用 , 给 当前 的 功能 开发 提供 及 时 的 质量 反馈 。 如 果 只 是 在 补充 原 有 功能 的 自动 化 测试 
用 例 ， 那 么 自动 化 测试 的 功能 覆盖 很 可 能 一 直 落 后 于 功能 开发 ,无 法 及 时 起 到 保护 网 的 作 
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用 ， 这 让 你 在 自动 化 测试 方面 的 投入 价值 会 大 大 降低 。 

当然 ， 这 种 跟随 策略 对 团队 要 求 比较 高 ， 必 须 做 到 沟通 及 时 且 顺 畅 。 这 也 是 在 工程 管 
理 方 面 比较 优秀 的 软件 公司 中 , 大 多 数 的 自动 化 测试 用 例 是 由 软件 开发 工程 师 自行 负责 编 
写 的 原因 。 因 为 对 同一 个 功能 来 说 ， 如 果 一 个 人 写生 产 代 码 ， 另 一 个 人 写 测试 代码 ， 那 么 
他 们 之 间 就 需要 沟通 ， 产 生 沟 通 成 本 。 

3. 从 测试 金字 塔 的 中 间 层 向 上 下 两 端 扩展 

如 果 你 还 没有 自动 化 测试 用 例 ， 刚刚 打算 开始 写 自动 化 测试 用 例 ， 那么 在 测试 金字 塔 
中 ， 测 试 最 好 从 中 间 层 级 别 开 始 入 手 ， 投 入 产 出 比 最 高 。 例 如 ， 前 面 提 到 的 在 线 视频 网 站 
的 例子 中 ， 对 于 采用 微服 务 架构 的 服务 端 软件 ， 最 好 从 契约 测试 层 开 始 着 手 。 而 对 移动 端 
应 用 来 说 ， 最 好 从 组 件 级 或 API 级 的 测试 开始 入 手 。 

4. 自动 化 测试 用 例 的 质量 比 数量 重要 

自动 化 测试 也 是 代码 ， 需 要 维护 ， 维 护 就 要 产生 成 本 。 因 此 ， 在 达到 质量 目的 的 前 提 
下 ， 自 动 化 测试 用 例 越 少 越 好 。 

首先 ， 数量 够 用 就 行 ， 绝 不 要 写 不 必要 的 测试 代码 。 客 户 不 会 为 你 的 自动 化 测试 代码 
买单 。 有 多 少 个 自动 化 测试 不 重要 ， 对 代码 质量 有 信心 才 是 重要 的 。 好 的 自动 化 测试 比 测 
试 数量 重要 。 

其 次 ， 不 要 在 不 同 层级 的 测试 〈 例 如 单元 测试 层 和 组 件 测 试 层 ) 中 ,针对 相同 的 逻辑 
编写 测试 用 例 。 

最 后 ， 要 在 实现 成 本 最 低 的 测试 层级 上 进行 相应 业务 逻辑 的 测试 。 例如， 在 组 件 和 服 
务 层级 能 够 覆盖 的 业务 逻辑 ， 就 不 要 用 端 到 端的 测试 用 例 来 覆盖 。 一 些 在 单元 测试 层级 上 
不 容易 构造 的 测试 ， 也 可 以 在 其 上 一 层级 编写 测试 用 例 进行 验证 。 

10.3.2 ”提高 自动 化 测试 的 执行 次 数 

一 且 团 队 决 定 在 自动 化 测试 方面 进行 投入 ,为 了 提高 自动 化 测试 的 收益 ， 那 么 ， 提 高 
自动 化 测试 的 执行 次 数 是 一 种 不 错 的 好 办 法 。 当 然 ， 我 们 并 不 是 鼓励 在 同一 场景 下 重复 执 
行 多 次 测试 用 例 ， 而 是 指 在 多 个 不 同 的 场景 中 重复 利用 这 些 已 经 写 好 的 自动 化 测试 用 例 。 
例如 ， 开 发 人 员 在 修改 代码 的 过 程 中 ， 提 交代 码 变 更 前 ， 提 交代 码 变 更 之 后 ， 多 人 提交 代 
码 后 的 集成 之 时 ， 而 不 仅仅 是 正式 提 测 时 才 执 行 一 次 测试 用 例 。 如 何 才 能 真正 有 效 地 提高 
执行 次 数 呢 ? 

1. 共享 自动 化 测试 用 例 

任何 人 写 的 自动 化 测试 用 例 都 是 公司 的 资产 。 因 此 , 在 整个 团队 共享 这 些 自动 化 测试 
用 例 ， 让 所 有 人 都 能 够 受益 ， 才 是 使 自动 化 测试 用 例 价值 最 大 化 的 最 佳 方式 之 一 。 

2017 年 ， 我 帮助 过 一 家 互联 网 创业 公司 ， 当 时 公司 开发 人 员 有 50 多 人 ,测试 人 员 为 8 
人 , 全 部 做 手工 测试 。 其 中 一 名 测试 人 员 非 常 好 学 , 自己 学 会 了 Python 和 测试 工具 Postman。 
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于 是 他 写 了 很 多 接口 自动 化 测试 , 并 且 每 天 会 运行 几 次 自动 化 测试 ， 用 于 验证 生产 环境 的 
所 有 接口 是 否 正常 工作 。 然 而 ,这些 自动 化 测试 用 例 只 保存 在 他 自己 的 计算 机 中 ， 也 只 有 
他 自己 可 以 执行 。 
自如 他 能 将 这 些 自 动 化 测试 用 例 进行 一 定 的 重 构 ,使 其 可 以 针对 不 同 的 环境 (如 测试 
环境 、 预 生产 环境 ) 进行 适 配 ， 那 么 这 些 自动 化 测试 用 例 就 可 以 在 多 个 环境 下 共享 。 
恨 如 他 能 将 这 些 自动 化 测试 用 例 放 到 团队 的 代码 仓库 中 , 就 可 以 与 其 他 人 员 共 享 。 那 
么 ， 可 以 让 更 多 的 人 员 来 使 用 它 ， 节 省 更 多 的 人 力 资 源 。 
自如 他 能 将 这 些 自 动 化 测试 用 例 集 成 到 他 们 的 持续 部 署 流水 线 中 , 那么 就 可 以 自动 执 
行 ， 做 到 无 人 值守 。 

2. 开发 人 员 是 自动 化 测试 的 第 一 用 户 

如 果 每 个 软件 开发 人 员 在 编写 代码 的 时 候 ， 随 时 都 能 够 非常 方便 地 运行 自动 化 测试 用 
例 , 将 自动 化 测试 用 例 作 为 开发 过 程 中 的 质量 保护 网 , 快速 得 到 修改 代码 以 后 的 质量 反馈 ， 
那么 这 些 自 动 化 测试 就 会 每 天 被 运行 多 次 。 因 此 ， 要 真正 发 挥 自动 化 测试 的 威力 ， 应 该 将 
其 作为 开发 人 员 日 常 开发 中 的 一 张 质量 保护 网 ， 而 不 是 测试 人 员 用 来 验收 开发 人 员工 作成 
果 的 工具 。 
10.3.3 良好 自动 化 测试 的 特征 

为 了 能 够 让 所 有 人 更 好 更 容易 地 执行 自动 化 测试 ， 满 足 “ 快 速 、 便 捷 、 可 信 、 及 时 ” 
的 基本 要 求 , 我 们 需要 编写 良好 的 自动 化 测试 。 通常 来 说 , 良好 的 自动 化 测试 用 例 具 有 以 下 
特征 。 

1. 用 例 之 间 必 须 相 互 独立 

测试 用 例 之 间 应 该 是 相互 独立 的 , 即 前 一 个 用 例 的 执行 结果 对 后 一 个 用 例 的 执行 没有 
影响 。 在 采用 传统 工作 方式 的 自动 化 测试 用 例 中 ， 经 常会 见 到 将 前 一 个 测试 用 例 的 结果 作 
为 后 一 个 用 例 的 输入 。 这 就 产生 了 用 例 之 间 的 执行 顺序 依赖 ， 导致 用 例 只 能 线性 执行 。 一 
旦 测试 用 例 过 多 , 会 导致 执行 时 间 太 长 ， 大 大 降低 自动 化 测试 的 反馈 效率 。 而 且 一 旦 测试 
执行 失败 ， 查 找 测 试 失败 的 原因 也 比较 困难 。 

2. 测试 用 例 的 运行 结果 必须 稳定 

“稳定 ”是 指 当 测试 脚本 和 被 测 代 码 都 保持 不 变 的 情况 下 ， 多 次 执行 的 测试 结果 应 该 
是 稳定 的 、 不 变 的 。 不 稳定 的 测试 用 例 只 会 给 出 错误 的 质量 信号 ,或 者 导致 团队 浪费 大多 
的 时 间 。 对 持续 集成 来 说 ， 不 稳定 的 测试 还 不 如 不 测试 。 

3. 测试 用 例 的 运行 速度 必须 快 

当 一 个 测试 用 例 由 多 个 执行 步骤 组 成 时 ， 每 个 步骤 都 需要 一 定 的 执行 时 间 。 为 了 让 测 
试 更 稳定 ， 在 写 测试 用 例 时 通常 都 会 让 每 一 步骤 有 充分 的 执行 时 间 ， 因 此 ， 经 常会 在 一 些 
步 又 中 使 用 类 似 sleep (2000) 这 样 的 语句 让 应 用 程序 等 待 足够 的 时 长 。 这 种 做 法 通常 会 导 
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致 测试 用 例 执 行 时 间 变 长 。 

我 们 通常 有 两 种 方式 应 对 这 种 问题 。 一 是 将 一 个 测试 用 例 分 解 成 多 个 独立 的 测试 用 
例 ， 每 个 用 例 仅 测试 原 有 测试 用 例 的 一 部 分 ， 这 样 就 可 以 并 行 执行 。 二 是 将 “等 待 ” 改 为 
“ 轮 询 ”， 即 以 很 小 的 时 间 间 隔 来 不 断 查询 是 否 到 达 下 一 步 执行 的 状态 。 这 样 可 以 减少 等 待 
的 时 间 ， 从 而 缩短 整个 测试 用 例 的 执行 时 间 。 

4. 测试 环境 应 该 统一 

在 编写 大 规模 的 自动 化 测试 经 验 比 较 少 的 团队 里 ,常会 遇 到 下 面 的 情况 : 编写 的 自动 
化 测试 用 例 只 能 在 某 个 测试 环境 上 执行 ， 甚 至 是 只 能 在 某 个 开发 人 员 的 开发 机 器 上 运行 。 
其 他 成 员 想 要 运行 这 些 已 有 的 自动 化 测试 时 , 必须 有 他 人 帮助 , 才能 把 测试 运行 环境 搞 好 。 
在 这 种 情况 下 ,这 些 已 编写 好 的 自动 化 测试 用 例 无 法 被 多 人 重用 ， 就 很 难 最 大 化 自动 化 测 
试 的 收益 。 


10.3.4 ”共享 自动 化 测试 的 维护 职责 


为 了 能 够 保持 自动 化 测试 的 良好 状态 , 保护 我 们 在 这 方面 的 投入 ,团队 应 该 共享 自动 
化 测试 用 例 的 维护 职责 。 

由 于 自动 化 测试 用 例 也 是 软件 代码 ， 因 此 应 该 由 具有 编码 和 软件 设计 能 力 的 人 来 写 。 
无 论 何 时 何 地 ， 测 试 代码 都 不 应 该 是 “二 等 公民 ” ,同样 要 在 测试 代码 的 设计 与 编写 上 花 
费 一 些 时 间 ， 以 便 使 其 易于 维护 ， 避 免 测 试 代码 腐烂 。 

如 果 测 试用 例 的 变更 无 法 与 需求 变更 的 速度 一 致 ， 那么， 虽然 开发 人 员 快 速 地 修改 好 
产品 代码 ,但 相应 的 测试 用 例 没有 得 到 及 时 更 新 ， 这 个 测试 用 例 一 定 会 运行 失败 。 当 这 种 
情况 发 生 较 多 的 时 候 ， 开 发 人 员 很 容易 对 自动 化 测试 用 例 的 结果 视而不见 ， 那 么 这 个 自动 
化 测试 用 例 集 也 就 失去 了 更 大 的 作用 ， 也 会 导致 越 来 越 多 的 自动 化 测试 用 例 失 败 ， 却 没有 
人 关注 ， 从 而 产生 “ 破 窗 效 应 "。 因 此 ， 必 须 让 自动 化 测试 尽 可 能 与 生产 代码 同步 变化 。 
而 最 好 的 同步 方式 就 是 当 开发 人 员 运 行 自 动 化 测试 失败 后 , 就 可 以 自己 动手 修改 对 应 的 代 
码 (可 能 是 功能 出 错 ， 也 可 能 是 自动 化 测试 需要 修改 )。 这 也 是 判断 自动 化 测试 意识 是 否 
识 入 人 心 的 一 个 指示 器 。 
























































破 窗 效应 


破 窗 效应 是 犯罪 学 的 一 个 理论 ， 此 理论 认为 : 环境 中 的 不 良 现 象 如 果 被 放任 存在 ， 
会 诱 使 人 们 仿效 ， 甚 至 变本加厉 。 以 一 疏 有 少许 破 窗 的 建筑 为 例 ， 如 果 那 些 破 窗 不 被 尽 
快 修好 ， 可 能 将 会 有 破坏 者 破坏 更 多 的 窗户 。 最 终 他 们 甚至 会 间 入 建筑 内 ， 如 果 发 现 无 
人 居住 ， 也 许 就 在 那里 定居 ， 甚 至 纵火 。 在 一 面 墙 上 出 现 一 些 涂鸦 ， 如 果 没 有 被 马上 清 
洗 掉 ， 很 快 ， 墙 上 就 布 满 了 乱 七 八 糟 、 不 堪 入 目的 东西 ; 一 条 人 行道 有 些许 纸 悄 ， 不久 
后 就 会 有 更 多 垃圾 ， 最 终 人 们 会 理所当然 地 将 垃圾 顺手 丢弃 在 地 上 。 
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10.3.5 “代码 测试 覆盖 率 


代码 测试 覆盖 率 是 一 个 非常 有 趣 的 指标 。 有 很 多 人 对 它 做 过 调查 研究 ， 还 得 到 一 些 相 
互 矛盾 的 结果 。 有 些 人 认为 它 是 一 个 非常 有 用 的 指标 ， 应 该 要 求 达到 一 定 比 例 的 测试 覆盖 
度 。 而 另 一 些 人 则 认为 ， 它 是 一 个 有 用 的 工具 ,但 是 只 能 告诉 你 “哪些 代码 缺乏 测试 用 例 
覆盖 ”， 却 无 法 告诉 你 “被 覆盖 的 代码 就 一 定 是 真正 经 过 民 好 验证 的 代码 ”。 还 有 一 部 分 人 
认为 ， 衡 量 覆盖 率 是 有 害 的， 因为 它 提供 的 是 一 种 错误 的 安全 感 。 

谷歌 公司 在 GTAC 2014 大 会 上 ， 也 公布 了 他 们 的 自动 化 测试 的 语句 覆盖 率 ， 它 只 包括 
使 用 单元 测试 框架 编写 自动 化 测试 所 达到 的 覆盖 率 。 该 数据 来 自 公司 内 部 650 个 项 目的 10 
多 万 次 代码 提交 ， 数 据 收集 的 时 间 跨 度 为 一 个 月 ， 如 图 10-12 所 示 。 











谷歌 公司 一 个 月 内 的 覆盖 率直 方 图 


洋 卫 总 


SY 
测试 覆盖 率 (百分比 ) 
图 10-12 ”谷歌 公司 2014 年 自动 化 测试 覆盖 率 统计 图 


图 10-12 中 履 盖 率 的 中 位 数 为 78%，75 分 位 数 为 83%，90 分 位 数 为 90%。 每 个 项 目的 测 
试 覆 盖 率 各 不 相同 ， 而 且 不 同 的 编程 语言 ， 甚 测试 覆盖 率 也 不 相同 ， 每 种 编写 语言 各 自 的 
平均 测试 覆盖 率 如 图 10-13 所 示 。 谷歌 公司 并 设 有 规定 测试 覆盖 率 的 统一 标准 ， 只 有 一 个 建 
议 性 标准 ， 即 单元 测试 覆盖 率 达 到 85%。 

现实 情况 是 ， 很 多 创业 公司 在 初期 都 不 写 自 动 化 测试 用 例 。Facebook 在 2004 年 刚刚 上 
线 时 ,， 也 没有 写 自动 化 测试 。 由 于 业务 发 展 迅猛 , 工程 师 人 数 大 幅 增加 ， 系 统 复杂 度 增 加 ， 
随 之 而 来 的 是 软件 交付 质量 变 差 , 缺陷 比较 多 , 开发 人 员 常 常 处 于 救火 状态 。 于 是 ， 自 2008 
年 开始 ，Facebook 正 式 引 入 自动 化 测试 实践 ， 其 Web 网 站 代码 每 次 发 布 之 前 运行 的 自动 化 
测试 数量 逐步 增多 , 如 图 10-14 所 示 , 但 对 于 需要 写 多 少 自动 化 测试 , 公司 也 没有 统一 规定 ， 
直到 现在 也 是 如 此 。 值 得 关注 的 一 点 是 ，Facebook 公 司 中 这 些 自动 化 测试 用 例 的 大 多 数 由 
开发 工程 师 自己 负责 。 
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图 10-13 ”谷歌 公司 不 同 编程 语言 的 测试 覆盖 率 统计 
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图 10-14 2008 一 2012 年 Facebook 公 司 自动 化 测试 用 例 的 增长 趋势 


虽然 ， 经 常 有 人 问 类 似 “ 测 试 覆 盖 率 到 底 达 到 多 少 合适 ? ”这 类 问题 ， 但 是 从 上 面 的 
各 种 数据 看 ， 这 个 问题 可 以 说 “非常 重要 ”， 也 可 以 说 “非常 不 重要 ”。 写 自动 化 测试 不 是 
为 了 测试 覆盖 率 的 数值 ， 而 是 运行 这 些 自动 化 测试 以 后 ， 对 自己 正在 开发 的 软件 质量 到 底 
有 多 少 信心 。 


10.4 用 户 验 收 自动 化 测试 要 点 


用 户 验 收 自动 化 测试 用 例 处 于 自动 化 测试 金字 塔 的 最 高 一 层 , 也 是 单个 测试 用 例 的 成 
本 最 高 的 。 在 开发 更 多 的 用 户 验 收 自动 化 测试 用 例 之 前 ， 必 须 精心 准备 ， 以 便 尽 可 能 以 较 
低 的 成 本 持续 维护 比较 健康 的 测试 用 例 集 。 


10.4.1 先 搭建 分 层 框架 


在 多 人 同时 大 量 开发 用 户 验收 自动 化 测试 时 ， 应 该 先 做 好 测试 脚手架 。 现在 的 通用 测 
试 工具 与 框架 非常 多 , 但 与 所 有 的 编程 语言 一 样 ， 它 们 都 不 是 某 一 特定 业务 领域 的 专属 测 
试 框架 。 为 了 能 够 让 测试 脚本 更 容易 维护 ， 应 该 先 利 用 这 些 通用 测试 工具 ， 在 自己 产品 的 
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业务 领域 内 建立 专 有 领域 语言 的 自动 化 测试 机 制 。 这 样 才能 使 得 自动 化 测试 用 例 易于 维护 
和 修改 ， 从 而 减少 维护 成 本 。 

下 面 ， 我 们 以 Web 页 面 的 自动 化 工具 Selenium 为 例 ， 说 明 特定 业务 领域 的 专属 测试 框 
架 形成 过 程 。 图 10-15 是 一 个 用 于 搜索 国内 机 票 的 表单 。 我 们 要 对 机 票 搜索 业务 编写 一 些 自 
动 化 测试 用 例 ， 用 于 验证 功能 的 正确 性 。 








@ 单程 往返 


北京 2017-11-21 3 


可 实时 搜索 28 万 条 国内 国际 航线 立即 搜索 


图 10-15 ”搜索 国内 机 票 的 网 页 表单 


如 果 我 们 使 用 Selenium 工 具 所 提供 的 原生 API 直 接 编写 自动 化 测试 用 例 ， 那 么 其 测试 
代码 的 内 容 类 似 于 图 10-16 中 的 代码 。 





























0 

1 WebDriver.open(“http://www.mytrip.com”); 

2 webDriver.findElement (By.xpath(“//div[contains(@id, 'single_trip’)]//input")).click(); 

3 webDriver.findElement (By.xpath(“//div[contains(@id, 'from’)]//input”")).sendKeys(" 北 京 "); 

4 webDriver.findElement (By.xpath(“//div[contains(@id, 'to’ )]//input”)).sendKeys ("深圳 "); 

5 webDriver,.findElement (By.xpath(“//div[contains(@id, 'date’)]//input”")).sendKeys("2020-09-01"); 


6 webDriver.findElement (By.xpath(“//a[contains(@id, ’searchBtn’)]//button”)).click(); 

7 sleep(1000); 

8 WebElement counterELement= webDriver.findElement (By.xpath(“//div[text()="'"+counter+""]"")); 
9 Assert.assertNotNull(counterElement); 








图 10-16 使 用 Selenium 原 生 API 编 写 自 动 化 测试 用 例 脚 本 


第 1 行 代码 表示 打开 首页 ， 第 2 行 代码 到 第 5 行 代码 是 找到 页 面 表单 中 的 每 一 个 输入 框 ， 
并 对 其 进行 赋值 ， 第 6 行 代码 是 找到 提交 按钮 ， 并 点 击 ， 第 7 行 代码 是 让 程序 暂停 1 秒 钟 ， 等 
待 页 面 返回 搜索 结果 , 第 8 行 代码 是 找到 机 票 搜索 结果 的 总 数 , 第 9 行 代码 是 确认 总 数 不 为 空 。 

这 段 自 动 化 测试 脚本 主要 存在 两 个 隐患 。 一 是 可 读 性 差 。 对 一 个 刚刚 拿 到 这 份 代码 的 
人 来 说 , 假如 没有 逐 行 地 仔细 研读 代码 ,很 可 能 完全 不 知道 这 个 测试 用 例 的 每 一 行 到 底 在 
做 什么 。 二 是 可 维护 性 差 。 假 如 需要 多 种 测试 数据 对 这 个 场景 进行 测试 ， 那 么 会 产生 很 多 
类 似 的 重复 代码 。 

是 否 有 其 他 编写 方式 ， 能 够 更 好 地 表现 测试 意图 ,更 容易 与 他 人 交流 呢 ? 我 们 下 面 就 
以 同样 的 测试 内 容 为 例 ， 对 其 进行 重新 设计 。 一 般 来 说 ， 自 动 化 测试 用 例 的 代码 框架 结构 
可 划分 为 3 个 不 同 的 层次 。 

(1) 测试 用 例 的 描述 层 。 它 用 于 人 与 人 的 沟通 交流 。 上 面 的 测试 用 例 可 以 用 文本 的 方 
式 书写 ， 如 图 10-17 所 示 ， 每 个 人 都 可 以 轻松 地 知道 这 个 测试 的 测试 目的 与 内 容 。 
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搜索 <date> 从 <from> 到 <to> 的 航班 ， 
应 该 包含 航班 <fLight> 


Example: 

ldata Ifrom |to |fLight | 
|20190101 ”| 北京 | 深圳 |CA1365 | 
120196101 “| 深圳 | 北京 |CA1366 | 


10-17 ”自动 化 测试 用 例 的 描述 层 示例 


(2) 测试 用 例 的 实现 层 。 它 用 于 将 上 面 的 描述 层 与 程序 脚本 对 应 在 一 起 ， 并 可 实现 测 
试 意图 。 实 现 层 的 示例 代码 可 能 如 图 10-18 所 示 ， 其 中 函数 方法 侧 ght_search(String date， 
String from, String to) Lm A 因此 ， 只 要 有 类 似 的 操作 ， 
就 可 以 复 用 这 个 函数 。 在 这 上段 代码 中 ， 还 有 两 个 封装 好 的 领域 对 象 ， 分 别 是 类 
FlightHomePage 和 SearchResultPage， 它 们 都 是 Page 的 子 类 ， 它 们 也 是 机 票 预订 领域 语言 的 

一 部 分 。 当 我 们 编写 更 多 的 测试 用 例 时 ， 只 需要 使 用 这 些 封 装 好 的 业务 相关 领域 对 象 ， 而 
不 是 类 似 于 图 10-16 中 的 原生 WebDriver API。 通 过 这 种 形式 的 抽象 ， 可 以 将 测试 目的 不 相 
同 的 代码 集中 在 几 个 文件 或 方法 中 。 这 样 令 大 规模 的 测试 用 例 编写 变 得 简单 易 上 手 ， 同 时 
由 于 这 些 测试 用 例 具有 高 可 读 性 ， 也 可 以 提高 不 同 团队 成 员 之 间 的 沟通 效率 。 


























public void flight_search(String date, String from” String to) { 
FlightHomePage page = applicationFactory.get(FlightHomePage.class); 
this.homePage = page; 
homePage. search(data, from, to); 

} 

public should_contains(String flightNumber) { 
Page searchResultPage = homePage.getResult(); 


assertTrue(SsearchResulLtPage,contains(fLightNumber) ); 














图 10-18 自动 化 测试 用 例 的 实现 层 示例 


(3) 测试 用 例 的 接口 层 。 它 对 通用 测试 工具 提供 的 API 进 行 一 定 的 封装 ， 把 那些 与 测 
试 领域 不 相关 的 代码 实现 细节 隔离 ， 并 为 上 层 的 实现 层 提供 :一些 可 重用 的 基本 接口 集合 
甚 示例 代码 如 图 10-19 所 示 。 这 段 代 码 被 封装 于 FlightHomePage 对 象 中 。 将 非常 细节 性 的 技 
术 实 现 都 封装 到 少数 的 类 对 象 中 ， 有 利于 后 续 的 修改 。 

public void search(String date, String from, String to) { 


WebElement dateInput = webDriver.findElement(By.id(date)); 
dateInput. sendKeys (date); 











图 10-19 ”自动 化 测试 用 例 的 接口 层 示例 


选择 哪些 功能 做 自动 化 测试 , 来 提炼 软件 项 目的 测试 脚手架 呢 ? 


通常 可 以 选择 软件 中 
比较 基础 或 常用 的 功能 ， 针 对 它们 编写 用 户主 流程 的 自动 化 测试 用 例 。 这 些 


功能 通常 相对 
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比较 稳定 ， 不 会 剧烈 变化 ， 同 时 也 是 所 在 业务 领域 中 的 核心 功能 ， 更 容易 抽象 出 常用 的 测 
试 脚手架 。 一 旦 基本 搭建 完成 测试 脚手架 ， 就 可 以 在 比较 大 的 范围 内 开展 自动 化 测试 用 例 
的 编写 了 。 


10.4.2 ”测试 用 例 数 应 保持 低位 


正如 前 面 我 们 讨论 过 的 测试 金字 塔 所 指出 的 那样 , 处 于 顶层 的 用 户 验收 自动 化 测试 的 
数量 不 应 该 太 多 。 那 么 ， 这 么 少 的 测试 数量 ， 应 该 覆盖 哪些 场景 ? 验证 的 重点 是 什么 ? 

首先 ， 用 户 验收 自动 化 测试 应 该 以 用 户 旅程 地 图 (User Journey Map) 的 方式 来 验证 
软件 应 用 或 服务 的 核心 工作 流程 。 用 户 旅 程 地 图 是 指 一 系列 的 主要 交互 过 程 ， 它 们 从 用 户 
角度 出 发 ， 以 叙述 故事 的 方式 描述 用 户 与 软件 产品 之 间 的 交互 。 

其 次 , 用 户 验 收 自动 化 测试 应 该 验证 软件 应 用 或 服务 的 端 到 端 行为 ,而 非 具体 实现 细 
市 。 例 如 ， 当 验证 系统 登录 行为 时 ， 其 验证 的 目标 主要 是 验证 整个 登录 流程 是 否 得 到 正确 
执行 ， 而 不 是 验证 输入 信息 是 否 非法 ， 因 为 后 者 可 以 通过 更 低层 次 ( 且 更 低 成 本 ) 的 自动 
化 测试 用 例 来 覆盖 。 


10.4.3 为 自动 化 测试 用 例 预 留 API 


在 编写 这 类 测试 用 例 时 ,应 该 尽量 调用 位 于 界面 下 层 的 ApI 来 驱动 业务 流程 的 执行 ,而 
少 用 模拟 图 形 界面 操作 的 代码 。 图 形 界 面 是 给 人 类 交互 使 用 的 ， 并 不 是 给 机 器 使 用 的 。 界 
面 操作 通常 反应 比较 慢 ， 且 很 多 情况 下 不 容易 定位 界面 元 素 ， 容 易 出 现 运行 不 稳定 的 代码 。 

这 要 求 在 程序 设计 时 就 考虑 到 端 到 端 自动 化 测试 的 便捷 性 , 支持 相应 的 API 驱 动 方式 。 
例如 , 你 可 以 使 用 界面 在 系统 上 创建 一 个 登录 账户 , 同时 也 应 该 能 够 通过 RESTAPI 创 建 几 
户 , 有 时 甚至 为 了 自动 化 测试 的 便利 性 , 也 应 该 增加 必要 的 APL, 只 是 不 对 外 开放 这 类 API。 
在 生产 环境 上 发 布 时 ， 也 可 以 通过 技术 手段 隐藏 或 去 除 这 些 API。 
10.4.4 为 调试 做 好 准备 

通过 各 种 手段 让 端 到 端 自动 化 测试 的 调试 更 容易 ， 如 提供 完整 的 日 志文 件 ， 记 录 常 见 
的 测试 失败 模式 ， 保留 所 有 相关 的 系统 状态 信息 , 如 自动 截屏 、 出 错时 的 现场 镜像 保存 等 。 
10.4.5 ”测试 数据 的 准备 

除 编写 测试 代码 以 外 ， 自 动 化 测试 还 有 一 个 重要 的 工作 ， 那 就 是 测试 数据 的 准备 。 测 
试 所 需要 的 数据 可 以 分 成 3 类 。 第 一 类 是 确保 应 用 程序 启动 所 需 的 最 基本 数据 ， 例 如 ， 一 些 
应 用 初始 化 所 需要 的 数据 ， 如 元 数据 、 字 典 表 等 。 第 二 类 是 令 某 一 类 测试 组 成 的 测试 用 例 集 
达到 预期 状态 所 需要 的 数据 。 第 三 类 是 某 个 具体 测试 用 例 执行 ， 它 自己 所 需要 准备 的 数据 。 
当然 , 每 次 执行 测试 后 , 很 可 能 都 会 对 原 有 数据 产生 修改 。 为 了 保持 测试 用 例 之 间 的 独立 性 ， 
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一 个 测试 用 例 执 行 完成 以 后 ， 应 该 消除 它 对 原 有 数据 产生 的 影响 ， 恢 复数 据 原始 状态 。 
不 同 层级 上 的 测试 类 型 ， 其 数据 准备 成 本 与 方式 也 各 不 相同 。 对 用 户 验 收 自动 化 测试 
来 说 ， 可 能 就 需要 稍为 复杂 的 准备 工作 。 
(1) 通过 一 些 规则 ， 编 写 程序 自动 生成 数据 。 甚 不 足 之 处 在 于 : 当 规则 复杂 时 ， 数 据 
生成 的 程序 比较 难于 编写 和 维护 。 
(2) 通过 录制 手工 测试 时 产生 的 数据 。 
(3) 将 生产 环境 的 非 敏感 数据 克隆 一 份 ， 或 者 截取 数据 片断 。 
(4) 进行 生产 环境 数据 的 自动 化 录制 、 保存 并 备份 , 例如 对 搜索 算法 的 优化 项 目 来 说 ， 
可 以 将 查询 记录 全 部 记录 下 来 ， 作 为 自动 化 测试 的 输入 数据 。 
实时 生产 环境 的 数据 流量 克隆 ， 如 图 10-20 所 示 。 其 原理 是 : 在 流量 请 求 的 入 口 处 增 
加 一 个 请 求 克隆 器 。 当 生产 环境 的 请 求 进入 以 后 ， 该 克隆 器 将 其 克隆 一 份 请 求 后 ， 原 有 的 


请 求 仍 | 


到 新 版 本 的 服务 ( 即 























日 通过 原来 的 服务 进行 正常 处 理 ( 即 





般 来 说 ， 常 用 的 方法 有 下 面 4 种 。 








图 10-20 中 的 服务 1.0) ， 而 克隆 出 来 的 请 求 引流 














图 10-20 中 的 服务 2.0)， 从 而 进行 新 版 本 的 相关 测试 。 这 种 方式 通常 应 





用 于 互联 网 产品 的 测试 中 ， 是 暗部 署 的 一 种 实现 方式 〈 关 于 暗部 署 的 概念 ， 参 见 第 12 章 )。 
返回 请 求 








图 10-20 ”生产 环境 的 流 


克隆 


地 





太平 洋 中 的 “虚拟 城市 ” 

某 网 约 车 平台 的 在 线 压 测 有 类 似 的 做 法 。 打 车 出 行 有 非常 明显 的 潮汐 现象 (每 天 多 
个 用 车 高 峰 和 低谷 )。 工 程 师 就 想到 了 实时 流量 克隆 的 方式 。 当 然 ， 克 隆 的 不 只 是 流量 ， 
还 需要 克隆 城市 。 例 如 将 北京 市 的 数据 克隆 一 份 ， 将 其 经 纬度 做 漂移 ， 使 得 这 个 克隆 出 
来 的 北京 市 漂浮 在 太平 洋 上 。 同 时， 将 司机 和 乘客 的 实时 坐标 进行 克隆 并 进行 同样 的 经 
纬度 漂移 。 这 样 ， 就 可 以 在 这 个 太平 洋 上 的 北京 市 ， 对 新 版 本 的 代码 进行 压 测 了 。 
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10.5 ”其 他 质量 检查 方法 

除了 前 面 讲 到 的 方法 ， 还 有 其 他 质量 检查 方法 可 以 用 。 下 面 简 单 介绍 一 下 。 
10.5.1 差异 批注 测试 方法 

差异 对 比 批注 测试 方法 (di 作 approval testing) 是 一 种 半自动 化 测试 方法 。 在 一 些 情况 
下 ,我 们 可 能 无 法 做 全 自动 化 用 户 验收 测试 。 例 如 软件 系统 需要 生成 很 多 动态 数据 的 图 片 
或 者 PDF 文件 (如 电子 发 票 ) 。 如 何 对 这 种 二 进 制 格式 的 产物 进行 自动 化 测试 呢 ? 此 时 可 以 
使 用 差异 批注 测试 方法 。 

差异 批注 标注 测试 是 指 : 当 将 预定 义 的 数据 集 输 入 系统 后 , 收集 运行 后 的 输出 结果 (如 
上 侈 中 的 图 片 或 PDF 文件 ), 对 其 中 需要 验证 的 数据 进行 提取 , 并 将 提取 的 结果 放 入 文本 文 
件 中 。 通过 前 后 两 次 测试 结果 的 对 比 , 用 人 工 批注 的 方式 进行 半自动 化 测试 。 其 步骤 如 下 。 

(1) 首次 运行 后 ， 人 工 对 这 些 文本 文件 的 内 容 标注 其 正确 性 ， 并 保存 起 来 。 

(2) 当 再 次 批量 运行 这 些 测 试 时 ， 将 运行 结果 与 上 次 保存 的 结果 进行 自动 对 比 。 

@ 如 果 疫 有 差异 ， 即 可 认为 本 次 输出 结果 是 正确 的 。 

@ 如 果 存 在 差异 ， 则 由 人 工 进行 再 次 审核 。 假 如 后 面 这 次 的 执行 结果 是 正确 的 ， 将 
它 批注 为 新 的 正确 结果 ， 以 便 作为 下 次 的 判断 基准 。 

例如 ， 对 于 前 面 提 到 的 动态 生成 PDF 文件 ， 我 们 就 需要 一 个 额外 的 转换 工具 ， 将 系统 
正常 输出 的 PDF 文件 ， 通 过 转换 工具 转 成 包含 重要 验证 信息 的 文本 文件 ， 如 图 10-21 所 示 。 
0 致 , 那么 就 需要 有 一 个 告警 , 但 这 个 告警 不 一 定 是 由 于 功能 出 错 了 ， 

可 能 是 新 增加 的 一 个 功能 逻辑 导致 输出 的 PDF 文件 格式 有 变化 。 

输入 数据 被 测 系统 正常 结果 验证 结果 


101010 
202023 一 
232994 
230230 


图 10-21 差异 批注 测试 方法 示意 图 


另外 ， 在 使 用 差异 批注 测试 技术 时 ， 需 要 注意 动态 信息 (如 日 期 时 间 数 据 ) 的 处 理 ， 
这 类 与 实时 时 间 相 关 的 信息 可 能 是 由 系统 时 间 自 动 生成 的 。 在 做 这 类 测试 时 ， 需 要 通过 某 
种 方式 过 滤 哄 声 。 

这 种 差异 标注 测试 的 创建 和 用 例 代 码 维 护 工作 可 能 不 多 , 但 需要 更 多 的 人 工 参与 , 这 
取决 于 是 否 有 强 有 力 的 工具 支持 。 而 且 ， 通 常 无 法 做 到 用 例 独立 性 ， 会 有 很 多 断言 。 这 类 
对 比 工具 也 有 很 多 ， 如 TextTest 或 者 ApprovalTests 。 
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10.5.2 ”代码 规范 检查 与 代码 动静 态 检测 


代码 风格 规范 检查 是 指 通过 一 些 工 具 , 依据 团队 定义 的 一 些 代 码 编写 规范 , 针对 源 代 
码 进行 检查 ， 如 发 现 破坏 规范 的 代码 ， 就 加 以 指正 。 这 些 工 具 党 用 的 有 Checkstyle、PMD、 
SonarQube 等 。 对 风格 规范 检查 来 说 ， 其 目的 更 多 地 是 增强 代码 的 可 读 性 和 易 维护 性 。 谷 
歌 公 司 工 程 师 在 做 代码 评审 时 ， 对 代码 可 读 性 要 求 就 非常 严格 。 

代码 动静 态 检测 是 指使 用 一 些 工 具 ， 对 产品 源 代码 进行 自动 化 扫描 ,发 现代 码 中 存在 
的 问题 或 潜在 风险 ， 是 一 种 投入 产 出 比比 较 高 的 质量 检查 手段 ， 可 以 分 为 静态 扫描 和 动态 
分 析 。 

静态 扫描 通常 是 指 写 好 源 代 码 后 , 无须 经 过 编译 器 编译 , 而 直接 使 用 一 些 扫描 工具 对 
其 进行 扫描 ， 找 出 代码 当中 存在 的 一 些 语义 缺陷 、 安 全 漏洞 的 解决 方案 。 其 实现 方式 包括 
两 种 ， 一 是 基于 语法 解析 方法 进行 模式 匹配 来 做 静态 分 析 ， 二 是 采用 模拟 程序 全 路 径 执行 
的 方式 进行 分 析 。 这 种 模拟 程序 执行 路 径 的 方式 比 启动 程序 动态 测试 的 方式 覆盖 路 径 更 
多 , 能 够 发 现 很 多 动态 测试 难以 发 现 的 缺陷 。 包 括 各 种 编程 语言 对 应 的 lint 工 具 等 , 还 有 很 
多 商业 化 工具 ， 如 Coverity、ColcWork 等 。 

动态 分 析 是 通过 在 真实 或 虚拟 处 理 器 上 执行 目标 程序 进行 分 析 , 例如 ,在 可 能 的 漏洞 
处 插入 专门 编制 的 故障 发 生 函 数 ， 这 些 函 数 的 作用 就 是 迫使 目标 软件 的 运行 产生 异常 ， 然 
后 通过 监控 程序 来 检查 是 否 发 生 了 边界 洪 出 或 其 他 异常 现 家 。 这 类 工具 常用 的 包括 
Valgrind、Purify 等 。 

通过 这 些 动静 态 工具 对 源 代 码 进行 分 析 扫描 ， 可 以 及 时 发 现 一 些 问 题 或 缺陷 ,以 及 潜 
在 的 安全 隐患 。 因 此 ， 像 自动 化 测试 一 样 ， 我 们 可 以 将 这 些 检查 集成 到 我 们 的 持续 交付 部 
署 流水 线 中 ， 甚 至 让 编写 代码 的 工程 师 自 助 执行 。 

值得 注意 的 是 ， 当 代码 库 的 规模 较 大 时 ， 这 种 质量 扫描 工作 可 能 会 花费 较 长 时 间 。 此 
时 就 应 该 在 提交 构建 之 前 ， 提 供 增 量 扫描 的 方式 。 而 将 完整 代码 库 的 扫描 放 到 后 期 执行 ， 
或 单独 执行 。 正 如 我 们 可 能 将 提交 构建 与 次 级 构建 分 开 一 样 ， 这 也 是 为 了 在 反馈 时 间 与 反 
馈 质量 之 间 取 得 平衡 。 
10.5.3 ”Al 在 测试 领域 的 应 用 

在 代码 分 析 、 缺 陷 定 位 等 方面 AI 工具 很 多 ， 其 他 UI、 安 全 性 测试 也 有 一 些 : Appdif、 
DiffBlue、BugDojo、 微 软 AI 安全 风险 检测 工具 、Facebook Sapienz 等 。 虽 然 这 些 智能 测试 
工具 还 在 探索 中 ,但 已 经 有 一 些 喜 人 的 成 果 出 现 。 

例如 ,2018 年 5 月 ,在 Facebook 的 工程 网 站 code.facebook.com 上 , Ke Mao 和 Mark Harman 
撰写 了 一 篇 文章 ， 名 为 《Sapienz: Intelligent automated software testing at scale》， 讲 述 了 
Sapienz 对 Facebook 自 身 安 卓 应 用 进行 智能 自动 化 软件 测试 的 结果 ， 称 :“ 除 能 够 加 速 测试 
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过 程 以 外 ，Sapienz 测 试 结果 的 假 阳 性 率 极 低 ……Sapienz 的 结果 报告 中 ， 需 要 修复 的 比例 
占 75%。” 


10.6 小 结 


前 置 周期 (lead time) 是 精益 生产 管理 中 的 一 个 概念 ， 它 是 指 从 用 户 下 订单 开始 到 其 
收 到 产品 之 间 的 时 间 周 期 。 这 个 时 间 周 期 越 得 ， 说 明 交 付 效率 越 高 ， 越 能 提升 客户 的 满 
意 度 。 

对 交付 频率 的 要 求 越 高 , 希望 前 置 周期 越 短 ， 自 动 化 测试 就 越 为 重要 。 我 们 讨论 了 软 
件 快速 交付 对 自动 化 测试 的 4 项 基本 要 求 ， 即 快速 、 便 捷 、 可 信和 及 时 。 为 了 能 够 做 到 这 4 
点 ,我 们 以 分 层 的 自动 化 测试 金字 塔 为 指导 ， 合 理 设计 自动 化 测试 的 实施 策略 ， 从 而 增加 
自动 化 测试 的 收益 。 对 自动 化 测试 的 实践 管理 来 说 ,希望 大 家 能 够 记 住 5 条 重要 原则 。 

(1) 自动 化 测试 用 例 运 行 次 数 越 多 ， 平 均 成 本 越 低 ， 收 益 就 越 大 。 








(2) 自动 化 测试 用 例 之 间 应 该 尽 可 能 相互 独立 ， 互 不 影响 。 

(3) 在 质量 有 保障 的 前 提 下 ， 自 动 化 测试 用 例 的 数量 越 少 越 好 。 

(4) 遗留 代码 的 自动 化 测试 编写 应 该 从 代码 热 区 开始 。 

(5) 自动 化 测试 用 例 从 测试 金字 塔 的 中 间 层 开始 补充 ， 投 入 产 出 比 最 高 。 
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6k6 一 切 自动 化 ”是 持续 交付 部 署 流水 线 的 一 个 重要 原则 ， 也 是 提升 “持续 交付 验证 
环 ” 运 转速 度 的 一 个 重要 影响 因素 。 随 着 软件 发 布 速度 越 来 越 快 ， 软 件 配置 管理 

已 经 成 为 “一 切 自 动 化 ”的 基石 。 

对 互联 网 产品 来 说 , 为 了 掌握 海量 用 户 的 真实 需求 , 同一 个 软件 服务 的 多 个 版 本 要 同 
时 运行 于 生产 环境 的 不 同 服务 器 上 ， 而 移动 终端 的 多 样 性 也 为 我 们 带 来 了 多 渠道 包 的 版 本 
管理 要 求 。 团 队 既 要 负责 当前 软件 需求 的 快速 欠 代 ， 又 要 同时 维护 多 个 历史 版 本 ， 处 理 历 
史 版 本 的 升级 问题 。 

所 有 这 一 切 都 为 软件 研发 与 运 维 管理 带 来 了 极 天 的 挑战 。 为 了 能 够 应 对 这 种 挑战 ， 配 
置 管理 的 重要 性 突显 。 因 此 ， 本 章 将 讨论 软件 配置 管理 的 目标 、 范 围 和 原则 ， 并 详细 介绍 
软件 包 的 配置 管理 内 容 ， 及 其 可 能 遇 到 的 问题 和 相应 的 解决 方案 。 


11.1 将 一 切 纳 入 配置 管理 


在 II 行业 中 ,“ 配 置 管理 ”一 词 被 广泛 使 用 ， 不 同 的 场景 下 代表 不 同 的 含意 。 在 软件 
生命 周期 管理 中 ， 它 与 版 本 控制 和 基线 管理 相近 ， 而 当 我 们 讨论 环境 准备 与 应 用 部 署 时 ， 
配置 管理 则 与 运 维 领域 的 配置 管理 数据 库 (Configuration Management Database，CMDB ) 
紧密 相关 。 

在 本 章 中 , 软件 配置 管理 是 指 在 整个 软件 生命 周期 中 , 对 生产 与 运行 环节 中 相关 产物 
的 管理 ， 包 括 产物 自身 及 其 唯一 标识 和 修订 历史 ,以 及 不 同 产物 之 间 的 关联 关系 等 。 其 目 
标 是 记录 并 管理 软件 产品 的 演化 过 程 , 确保 组 织 在 软件 生命 周期 中 的 各 个 阶段 都 能 得 到 精 
准 的 产品 配置 ， 并 提升 各 角色 间 的 协作 效率 。 

11.1.1 配置 管理 目标 

我 们 要 通过 软件 配置 管理 获得 两 种 基本 能 力 ， 它 们 分 别 是 可 追溯 性 和 可 重 现 性 ， 从 而 
提升 软件 整个 生命 周期 管理 的 安全 性 ， 并 提高 团队 协作 效率 。 

可 追溯 性 是 指 任何 人 在 获得 授权 的 前 提 下 ， 能够 找到 该 软件 的 任何 变更 历史 ， 即 对 任 
何 一 次 软件 变更 ， 都 可 以 准确 地 回答 SW1H， 即 谁 (who)、 什 么 时 间 (when)、 做 了 什么 
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(what)、 为 什么 (why)、 如 何 做 的 how)。 这 是 软件 组 织 信息 安 全 管理 中 的 一 个 重要 保 
障 手段 。 例如， 源 代码 版 本 管理 系统 (如 Git、Subersion 等 ) 就 属于 软件 配置 管理 工具 ， 它 
包含 代码 仓库 中 所 有 代码 的 修订 信息 。 

可 重 现 性 是 指 任何 人 在 获得 授权 的 前 提 下 , 能 够 重 现 从 过 去 到 现在 之 间 任 意 时 间 点 的 
软件 状态 。 除 信息 安全 管理 方面 的 贡献 外 , 它 还 是 各 角色 提升 协作 效率 的 最 重要 手段 之 一 。 

良好 的 软件 配置 管理 不 但 要 求 可 追溯 性 和 可 重 现 性 , 而 且 要 求 易 操 作 性 和 高 效 性 ， 即 
人 们 可 以 很 方便 地 追溯 和 重 现 软件 服务 在 某 时 间 点 的 指定 状态 。 男 外 ， 还 应 该 在 尽 可 能 少 
侵入 团队 成 员 正 常 活动 的 情况 下 ， 以 自动 化 方式 获得 配置 管理 所 需 的 信息 。 


11.1.2 配置 管理 的 范围 


自 软件 需求 被 提出 ， 并 被 放 入 需求 仓库 之 时 ， 一 款 软件 的 生命 周期 就 已 经 开始 了 。 为 了 
实现 某 一 业务 功能 ， 工 程 师 从 需求 仓库 取出 需求 ， 在 开发 环境 中 编写 代码 ， 并 将 其 提交 到 代 
码 仓 库 。 通 过 构建 环境 生成 一 个 软件 包 ， 存 储 于 临时 产物 仓库 。 该 软件 包 将 先后 被 部 署 到 不 
同类 型 的 环境 中 和 运行。 质量 验证 通过 后 ， 将 被 存储 于 正式 包 仓库 ， 经 预 生产 环境 验证 ， 最 终 
在 生产 环境 中 得 以 运行 ， 直 至 被 下 一 个 版 本 的 软件 包 所 取代 。 在 这 一 过 程 中 ， 一 共有 4 类 制 
品 (artifact) ， 它 们 分 别 是 需求 、 源 代码 、 软 件 部署) 包 和 环境 ， 这些 是 软件 配置 管理 的 范 
围 ， 如 图 11-1 所 示 。 如 果 你 的 软件 需要 被 团队 外 部 所 使 用 ， 还 需要 包括 软件 使 用 说 明 书 等 。 
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私服 库 
11-1 软件 配置 管理 的 范围 
11.1.3 ”软件 配置 管理 原则 
可 以 回答 下 面 的 问题 来 检验 一 下 企业 的 软件 配置 管理 水 平 。 
(1) 创建 一 套 全 新 的 软件 运行 环境 (如 测试 环境 、 预 生产 环境 ， 黄 至 生产 环境 )， 需 
要 花费 多 长 时 间 ? 在 创建 该 环境 的 过 程 中 ， 需 要 多 少 人 提供 支持 ?需要 多 少 手 工 干预 操 
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作 ? 只 要 有 授权 ， 任 何人 所 用 的 时 间 就 都 相同 吗 ? 

(2) 如 果 你 的 部 署 流水 线 服务 器 磁盘 损坏 ， 无 法 修复 ， 那 么 你 需要 多 长 时 间 重 新 建立 
并 配置 好 新 的 持续 集成 服务 器 ， 并 恢复 正常 使 用 ? 

为 了 得 到 这 两 个 问题 的 满意 答案 ， 就 必须 了 解 软件 配置 管理 的 3 个 基本 原则 ， 它 们 分 
别 是 : (1) 一 切 尼 有 版 本 ，(2) 共享 唯一 受信 源 ，(3) 标准 化 与 自动 化 。 

1. 一 切 皆 有 版 本 

对 应 用 软件 的 源 代 码 和 发 布 上 线 的 软件 包 进 行 版 本 管理 已 是 软件 行业 的 共识 。 但 是 ， 
当 需 要 更 快 地 发 布 软件 时 ， 这 种 程度 的 版 本 管理 并 不 充分 ， 也 不 全 面 。 

2017 年 ， 我 与 国内 某 个 互联 网 公司 (开发 与 测试 人 员 不 足 200 人 ) 交流 时 ， 我 问 了 一 
个 问题 :“ 为 某 业 务 软件 服务 创建 一 套 全 新 的 测试 环境 ， 需 要 花费 多 长 时 间 ? ”得 到 的 回 
答 是 : 开发 人 员 准 备 的 话 ， 需 要 两 个 小 时 ,测试 人 员 没 做 过 这 种 测试 环境 准备 工作 。 为 了 
知道 测试 人 员 需 要 花 多 长 时 间 , 开发 人 员 特 意 为 测试 人 员 撰写 了 一 份 该 系统 的 测试 环境 音 
署 文档 。 测 试 人 员 按 照 这 份 文 档 〈 如 表 11-1 所 示 ) 的 指导 说 明 ， 手 工 进行 操作 ， 开 发 人 员 
在 旁边 指导 。 与 此 同时 ， 开 发 人 员 还 根据 测试 人 员 的 反馈 ， 在 搭建 过 程 中 不 断 地 修订 这 份 
文档 。 最 终 的 结果 表明 需要 一 天 的 时 间 。 


表 11-1 某 互 联网 公司 的 业务 系统 环境 部 署 文档 








































































































































































































步 又 内 容 
1 安装 操作 系统 (找到 一 个 CentOS 6 或 以 上 版 本 的 副本 ， 并 安装 ) 
2 下 载 、 解 压 、 编 译 、 安 装 Nginx， 并 修改 配置 
3 安装 MySQL， 并 修改 配置 
4 安装 fftmpeg ,并 建立 软 链接 
安装 PHP 7.1 (启用 pdo_mysql 、curl、mb_string 模块 ): 
(1) 安装 依赖 软件 如 gcc, curl-devel; 
5 (2) 下载、 解压、 编译、 安装 php; 
(3 安装 yaf 扩 展 ; 
(4) 安装 redis 扩 展 ， 
(5) 启动 php-fpm 
安装 并 配置 应 用 程序 : 
(1) 从 aaa 项 目 仓库 拉 取 master 分 支 上 的 代码 ， 
(2) 更 新 配置 文件 (app.conf、advert.conf、db.conf、redis.conf) ， 把 配置 中 的 全 和 端口 改 成 
实际 项 目 中 应 用 的 即 可 
准备 上 传 文件 用 的 存储 目录 : 
入 (1) 在 www 目 录 下 新 建 uploads、downloads 和 device 目 录 ， 并 使 PHP 有 读 写 权限 ; 
(2) 在 项 目 根 目录 下 建 vavlogs 目 录 ， 并 使 PHP 有 读 写 权限 
8 数据 初始 化 ， 从 IP 为 xxx.xxx.xxx.xxx 的 mysql 中 导入 ad_zzz 库 的 表 结 构 和 初始 化 数据 
9 测试 ,访问 登录 页 面 http://$IP 
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表 11-1 是 对 该 文档 简化 后 的 版 本 ， 但 它 全 面 展 示 了 为 运行 某 个 业务 服务 需要 准备 的 所 
有 相关 内 容 ， 这 些 内 容 基本 可 分 为 3 个 层次 〈 如 图 11-2 所 示 ) ， 它 们 是 操作 系统 层 、 标 准 软 
件 (或 中 间 件 ) 层 和 应 用 软件 层 ， 其 变更 频率 自 底 向 上 逐渐 增加 。 

(1) 操作 系统 层 。 顾 名 思 义 ， 这 一 层 就 是 指 与 硬件 打交道 的 操作 系统 、 网 络 配置 以 及 
网 络 及 系统 通用 管理 服务 ， 如 表 11-1 中 的 第 1 步 所 列 。 

(2) 标准 软件 层 。 这 一 层 通常 包括 应 用 程序 所 依赖 的 标准 化 软件 包 。 这 里 的 标准 化 软 
件 包 是 指 以 独立 进程 形式 存在 ， 并 为 上 层 的 应 用 程序 提供 基础 服务 ， 如 数据 存储 、 消 息 通 
讯 、 网 络 服务 等 。 数 据 库 软件 、 消 息 中 间 件 或 者 Web 应 用 服务 器 等 ， 它 们 通常 以 软件 安装 
包 的 形式 ， 并 且 较 少 发 生变 化 ， 通 常 由 外 部 软件 市 场 提供 ， 如 MySQL 数 据 库 、Redis 服 务 
器 、ActiveMQ、Apache2 服 务 器 ， 或 者 为 分 布 式 应 用 提供 一 致 性 服务 的 软件 ZooKeeper 等 。 
例如 表 11-1 中 的 第 2 步 至 第 5 步 。 

(3) 应 用 软件 层 。 这 一 层 通常 包括 自身 团队 负责 开发 的 应 用 程序 ， 以 及 该 应 用 程序 运 
行 时 所 依赖 的 第 三 方 组 件 库 及 相关 数据 等 。 如 示例 中 的 第 6 步 到 第 11 步 。 其 中 ， 运 行 交 互 
的 第 三 方 软件 服务 是 指 由 其 他 软件 团队 负责 开发 维护 并 提供 的 软件 运行 时 服务 , 团队 自身 
无 法 对 其 进行 变更 或 修改 。 












































应 用 运行 


Et | 。 di i 的 个 
(导入 的 初始 数据 ) 


Pon 标准 应 用 软件 或 中 间 件 
标准 软件 层 (PHP/MySQL/Neginx/ 





Cpe 基础 操作 系统 相关 


图 11-2 ”软件 运行 栈 的 3 个 层次 














要 想 让 整个 系统 可 以 运行 ， 除 这 3 个 层次 中 的 软件 本 身 以 外 ， 我 们 还 需要 另外 两 种 内 
容 , 它们 分 别 是 软件 能 够 正确 启动 并 运行 所 需 的 软件 配置 信息 和 相关 数据 , 例如 , 在 表 11-1 
中 ， 在 第 6 步 对 app.conf、advert.conf、db.conf、redis.conf 等 配置 文件 中 的 JP 地址 修改 ， 以 
及 第 7 步 上 传 文件 目录 的 权限 修改 ， 还 有 第 8 步 中 用 于 数据 库 初 始 化 的 数据 。 

软件 配置 管理 是 否 仅 对 软件 源 代 码 以 及 这 3 个 层次 的 软件 、 配 置 文件 和 数据 进行 管理 
就 足够 了 呢 ? 除 对 生产 环境 中 的 软件 正常 运行 所 需 内 容 进 行 管理 以 外 , 还 需要 对 生产 软件 
过 程 中 的 相关 内 容 进行 管理 ， 这 些 内 容 包括 软件 测试 工具 包 或 测试 用 类 库 、 测 试 相关 的 代 
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码 、 测 试 运 行 所 需 的 测试 数据 ， 以 及 测试 相关 的 一 些 脚 本 。 

综 上 所 述 ， 除 产品 源 代码 以 外 ， 我 们 还 需要 对 图 11-3 中 的 所 有 内 容 进 行 管理 。 对 其 中 
内 容 的 任何 一 次 变更 ， 都 将 会 产生 一 次 新 的 快照 〈 即 新 的 版 本 对 应 关系 ) 。 而 每 一 次 变更 
都 应 当 来 自 某 个 业务 请 求 (要么 是 需求 变更 ,要么 是 缺陷 修复 或 者 技术 改造 )。 因 此 ， 软 
件 配 置 管理 的 第 一 原则 就 是 将 所 有 内 容 进行 版 本 变更 管理 , 也 就 是 说 ,一切 丝 须 版 本 管理 。 
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图 11-3 ”持续 交付 中 的 版 本 管理 内 容 








2. 共享 唯一 受信 源 

为 了 能 够 掌握 任意 时 刻 的 软件 状态 ， 并 确保 所 有 大 所 获取 的 信息 都 是 一 致 的 ， 整 个 组 
织 需 要 管理 唯一 受信 源 , 它 就 是 图 11-1 中 的 所 有 仓库 , 分 别 保存 3 种 类 型 的 数据 , 即 业 务 需 
求 /缺陷 、 源 代码 和 软件 包 。 所 有 团队 成 员 都 应 该 以 这 些 仓库 中 的 内 容 为 基准 ,相互 沟通 与 
协作 。 这 些 仓 库 是 企业 的 组 织 资产 之 一 ， 需 要 妥善 保管 。 不 同类 型 仓库 的 作用 如 下 。 

。 需求 仓库 : 保存 有 关 产 品 的 所 有 版 本 需求 描述 和 验收 条 件 ， 并 且 能 够 记录 每 一 次 
团队 对 需求 达成 共识 后 的 版 本 变更 记录 。 

e 代码 仓库 : 保存 所 有 源 代码 的 变更 历史 。 除 了 产品 源 代码 ， 还 包括 软件 包 整 个 生 
命 周 期 中 的 所 有 以 代码 形式 存在 的 内 容 ， 如 测试 代码 、 自 动 化 脚本 以 及 环境 配置 
信息 、 软 件 包 构建 依赖 信息 等 。 

。 软件 包 仓库 : 自动 保存 部 署 流水 线 生产 加 工 出 来 的 软件 包 ， 满 足 后 续 环 节 的 快速 
取 用 。 根据 其 中 不 同 内 容 的 使 用 方式 ,可 以 分 成 3 个 子 类 型 ， 分别 是 临时 产物 仓库 、 
正式 发 布 包 仓 库 和 外 部 软件 私服 库 。 

临时 产物 仓库 应 该 作为 研发 团队 内 部 各 角色 在 某 个 发 布 版 本 处 于 开发 期 间 进行 协作 

沟通 的 唯一 的 软件 包 受 信 源 ， 从 而 避免 因 环境 不 一 致 或 重复 打包 等 问题 而 引入 不 必要 的 风 
险 和 浪费 。 例 如 开发 人 员 将 自己 在 个 人 的 开发 环境 构建 出 来 的 软件 包 交 给 测试 人 员 , 而 其 
个 人 开发 环境 并 不 受 控 ,很 可 能 导致 安全 风险 或 文件 遗失 (如 文件 变更 忘记 提交 到 源 代码 
仓库 )。 正 确 的 做 法 是 : 软件 包 传 递 都 要 通过 软件 包 仓库 进行 ， 如 开发 人 员 通 知 待 测试 软 
件 包 在 临时 仓库 中 的 下 载 位 置 ， 测 试 人 员 根 据 这 一 信息 自行 从 临时 产品 仓库 中 获取 后 ， 再 
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进行 相关 验证 。 

正式 发 布 包 仓 库 用 于 保存 那些 通过 质量 验证 ， 即 将 上 线 或 者 已 经 上 线 的 所 有 软件 包 。 
与 临时 产物 仓库 的 管理 一 样 ， 这 些 仓库 保存 的 内 容 也 不 应 该 来 自 某 个 人 的 自行 构建 ， 而 是 
在 受 控 管理 系统 上 通过 人 工 (或 自动 化 方式 ) 标记 和 自动 传递 方式 ， 将 经 过 验证 达标 的 软 
件 包 从 临时 产物 仓库 转移 到 正式 发 布 包 仓库 中 。 

外 部 软件 包 仓 库 也 叫 第 三 方 软件 库 的 私有 服务 器 ， 用 于 存储 内 部 所 有 软件 所 需 引 用 、 
包含 或 使 用 的 外 部 第 三 方 受信 软件 包 。 这 一 仓库 应 该 文 持 应 用 软件 的 整个 生命 周期 的 第 三 
方 软件 管理 ,而 不 仅仅 是 生产 环境 中 第 三 方 软件 包 的 管理 ， 即 每 个 软件 团队 在 开发 过 程 中 
所 用 到 的 那些 非 自身 企业 开发 维护 的 外 部 软件 包 、 类 库 或 软件 工具 都 应 该 来 自 这 个 仓库 。 

很 多 团队 对 临时 产品 仓库 和 外 部 软件 私服 库 的 管理 较为 薄弱 ， 而 这 是 持续 交付 模式 
下 ， 需 要 重点 关注 和 管理 的 部 分 。 

3. 标准 化 与 自动 化 

软件 配置 管理 中 的 一 项 重要 工作 就 是 基线 管理 。 所 谓 “ 基 线 ”(baseline) ， 就 是 所 有 
仓库 在 某 一 时 刻 的 “快照 "”， 即 创建 基线 的 时 候 ， 对 仓库 中 的 当前 版 本 的 一 个 整体 标记 或 
复制 。 例 如 ， 当 一 个 项 目 进 行 到 某 个 里 程 碑 时 ， 需 要 对 项 目 文档 库 中 全 部 文档 创建 一 个 基 
线 ， 以 整体 记录 此 阶段 的 成 果 。 

为 了 有 利于 团队 协作 和 版 本 追溯 ,软件 配置 管理 应 该 制订 一 些 相应 的 标准 与 规范 〈 例 
如 分 支 策略 、 分 支 命名 、 分 支 Tag 命 名 、 产 特命 名 以 及 存放 位 置 、 源 代码 目录 结构 等 )。 这 
样 ， 当 每 个 人 都 了 解 并 遵守 管理 规范 以 后 ， 就 可 以 减少 很 多 不 必要 的 沟通 成 本 。 

当 具 有 标准 规范 以 后 ， 很 多 日 常事 务 性 操作 就 可 以 被 自动 化 〈 如 基线 ) ， 从 而 释放 更 
多 的 人 力 资 源 。 例如, 第 14 章 中 , 重新 定义 分 支 策略 后 ,团队 规范 了 不 同 分 支 的 使 用 方式 、 
软件 包 的 命名 规范 (如 每 个 标志 位 的 含义 、 标 志 位 的 自动 生成 机 制 等 ;， 原 来 很 多 易 出 错 
的 手工 操作 〈 如 拉 分 支 打 标签 、 录 入 版 本 号 并 打包 上 传 等 ) 都 被 自动 化 机 制 所 代替 。 

需要 注意 的 是 ， 规 范 化 和 标准 化 并 不 等 于 僵化 。 所 有 的 规范 管理 都 应 该 有 相应 的 改进 机 
制 ， 能 够 不 断 发 现 规范 管理 中 的 可 优化 点 ,并 持续 进行 优化 , 这 一 点 在 大 型 团队 中 尤其 重要 。 


11.2 软件 包 的 版 本 管理 


软件 服务 的 交付 周期 不 断 缩短 ， 同 时 ， 后 台 服 务 向 微服 务 架构 演变 , 终端 软件 也 向 微 
核 架 构 演进 ， 软 件 开 发 中 各 种 公共 组 件 的 复 用 。 这 一 切 使 我 们 必 将 面临 “软件 包 爆 炸 ” 的 
问题 。 也 就 是 说 ， 随 着 时 间 的 推移 ， 被 管理 的 软件 包 数 量 迅速 增长 。 如 何 对 这 些 软件 包 进 
行 有 效 的 版 本 管理 呢 ? 
11.2.1 包 管 理 的 反 模 式 

对 应 用 程序 所 依赖 的 软件 包 ， 以 前 常见 的 做 法 是 直接 将 它们 与 程序 源 代码 放 在 一 起 ， 
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提交 到 版 本 控制 库 中 。 这 种 方式 的 好 处 是 对 该 应 用 程序 的 开发 团队 比较 方便 简单 ， 能 够 做 
到 “ 开 箱 即 用 ”， 即 把 源 代码 从 版 本 控制 库 中 检 出 ， 就 可 以 开始 工作 了 。 对 这 种 做 法 来 说 ， 
比较 难 识别 软件 包 版 本 。 因 此 ， 当 把 软件 包 提 交 到 版 本 控制 仓库 时 ， 最 好 在 文件 名 中 也 加 
入 版 本 标识 信息 。 例 如 ， 对 Java 日 志 包 sl 人 fj 来 说 ， 应 该 使 用 sl 全 -1.7.21.jar 提 交 到 代码 库 ， 
而 不 是 slf4j.jar。 这 样 ， 能 够 比较 方便 地 识别 软件 包 的 版 本 。 

对 一 个 小 团队 的 小 项 目 来 说 , 这 种 做 法 够 用 了 ,但 对 一 个 人 数 和 项 目 较 多 的 企业 来 说 ， 
这 种 做 法 会 带 来 以 下 问题 。 

(1) 大 量 的 软件 包 以 二 进 制 的 形式 存在 于 版 本 控制 仓库 中 ,而 大 多 数 版 本 控制 系统 对 
二 进 制 文件 的 管理 是 非常 低 效 的 ， 而 且 有 LO 瓶颈 ， 且 无 法 有 针对 性 地 进行 传输 优化 。 

(2) 大 量 重复 的 软件 包 在 版 本 仓库 中 。 如 果 企 业 存在 比较 多 的 软件 项 目 (包括 已 进入 
维护 阶段 的 项 目 ， 还 有 处 于 活跃 开发 阶段 的 项 目 )， 则 版 本 控制 系统 中 会 存在 比较 多 的 重 
复 软件 包 ， 很 可 能 同一 个 软件 包 存 在 于 多 个 软件 项 目的 源 代 码 仓库 。 

(3) 公共 软件 包 的 协调 工作 增加 。 当 多 团队 协作 复杂 系统 开发 时 ， 很 多 小 团队 会 使 用 
其 他 团队 生产 出 来 的 软件 包 。 这 些 软件 包 的 变化 频率 远 高 于 来 自 企 业 外 部 的 软件 包 。 一 旦 
某 个 软件 包 更 新 ， 依 赖 该 软件 包 的 所 有 项 目 都 要 自己 手工 蔡 换 ; 
因此 ,尽管 这 是 一 种 非常 方便 的 包 版 本 管理 方式 但 是 > 当 企业 稍 具 规模 后 ， 我 们 不 
建议 将 任何 类 型 的 软件 包 保存 于 源 代码 的 版 本 管理 仓库 ,而 应 该 马上 建立 “集中 式 包 管理 
服务 。 


11.2.2 ”集中 式 包 管理 服务 


我 们 应 该 建立 企业 级 的 统一 软件 包 库 管理 系统 ,将 所 有 软件 包 都 放 入 其 中 ,并 且 对 企 
业内 部 团队 提供 稳定 的 查询 、 获 取 和 申请 等 服务 。 

查询 服务 是 指 内 部 人 员 可 以 方便 地 查询 他 想 找 的 软件 包 ; 获取 服务 是 指 能 够 通过 包 管 
理 服务 下 载 自己 所 需要 的 软件 包 版 本 ,并 且 做 到 版 本 正确 和 高 速 下 载 。 申 请 服务 是 指 没有 
查找 到 所 需要 的 软件 包 (通常 是 企业 外 部 的 第 三 方 软件 ) 时 ， 内 部 人 员 可 以 快速 提出 相应 
软件 包 的 使 用 申请 ， 并 在 第 一 时 间 内 快速 获得 响应 。 

企业 既 可 以 自己 开发 这 样 的 库 管 理 系统 , 也 可 以 使 用 开源 或 商业 的 包 管 理 软件 ， 比 较 
常见 的 有 Nexus 和 Artifactory。 这 两 个 软件 均 有 社区 版 本 和 商业 版 。 截 至 本 书写 作 期 间 ， 
Nexus Repository Manager OSS 3.x 可 以 管理 多 种 形式 的 仓库 ， 与 Bower、Docker、Git LFS、 
Maven、npm、NuGet、PyPI、Ruby Gems 和 Yum Proxy 等 配合 使 用 。 对 Java 项 目 而 言 ， 免 费 
版 本 的 Artifactory 在 很 多 细节 设计 上 比较 贴心 ， 容 易 上 手 。 

这 种 统一 包 管 理 方法 有 以 下 几 个 好 处 。 

e。 统一 存储 ， 空 间 占 用 少 。 

e 一 致 性 。 全 公司 使 用 统一 的 副本 ， 是 所 有 软件 包 的 唯一 来 源 。 
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e 安全 省 心 。 可 以 对 软件 包 进 行 统 一 的 安全 扫描 、 法 律 审 计 管理 。 当 某 软 件 包 出 现 
安全 漏洞 或 风险 时 ， 可 以 及 时 掌握 该 软件 包 的 使 用 范围 ， 定 位 风险 点 ， 制 订 统一 
的 风险 应 对 策略 。 
。 下 载 速度 快 。 在 公司 内 网 ， 软 件 包 的 获取 速度 较 快 。 
当然 ， 这 也 会 增加 一 些 成 本 。 首 先 ， 需 要 有 人 来 管理 维护 这 样 一 个 企业 系统 服务 。 其 
次 ， 将 第 三 方 软件 包 存 储 在 公司 内 部 服务 器 上 ， 会 占用 一 定 的 存储 空间 。 最 后 ， 容 易 形 成 
单 点 故障 ， 需 要 制订 相应 的 解决 方案 。 


11.2.3 ”软件 包 的 元 信息 


我 们 需要 一 些 信 息 来 描述 和 定义 软件 包 仓库 中 的 每 一 个 软件 包 , 以 方便 相互 引用 和 济 
源 、 检 索 。 这 些 信 息 被 称 为 软件 包 的 元 信息 ， 它 包含 以 下 信息 。 

e 其 自身 唯一 标识 信息 。 

e 来 源 信息 ， 如 由 谁 提供 、 源 代码 在 哪里 、 现 在 的 状态 如 何 (可 用 、 不 可 用 、 质 量 

情况 等 ) 。 

e 依赖 关系 。 它 是 否 引 用 了 其 他 软件 包 。 

1. 自身 唯一 标识 

每 一 个 软件 包 都 应 该 有 一 个 唯一 标识 。 通 常 对 该 标识 的 基本 要 求 是 : (1) 易于 理解 记 
忆 ; (2) 方便 查询 索引 。 尽 管 每 个 软件 组 织 都 会 根据 自身 的 情况 定义 软件 包 的 唯一 标识 格 
式 以 及 相关 的 语义 说 明 , 但 大 多 数 软 件 包 标识 格式 通常 都 由 以 下 两 部 分 组 成 ,软件 名 称 和 
版 本 号 。 其 中 ， 大 部 分 软件 的 版 本 号 可 分 为 4 段 ， 形 如 A.B.C.D， 每 段 由 一 个 整数 表示 ， 段 
与 段 之 间 由 小 数 点 分 隔 ， 如 1.0.12.1223， 其 含义 如 下 。 

e A 上 段 为 主 版 本 号 : 当 软 件 增加 重要 功能 或 功能 改版 ,或 者 出 现 向 后 不 兼容 的 改变 时 ， 

A 段 数字 通常 会 加 1。 当 A 段 为 “0” 时 ， 表 示 该 软件 功能 尚 不 完备 ， 未 正式 发 布 。 

e 了 B 段 为 次 版 本 号 : 表示 对 现 有 部 分 功能 的 增强 ， 而 且 功 能 一 定 是 向 下 兼容 的 。 

e C 段 是 修订 版 本 : 表示 只 有 较 小 的 修改 ， 例 如 修正 了 一 些 缺 陷 。 

e D 段 通常 是 自 定 义 段 ， 可 以 由 团队 自行 约定 。 

为 了 能 够 方便 与 用 户 沟通 交流 ， 有 些 软件 会 在 标识 中 增加 更 多 的 信息 。 例 如 ， 当 你 访 
问 goCD 自 身 产品 所 用 的 持续 交付 构建 平台 的 构建 打包 页 面 时 ， 在 Artifacts 标 签 页 中 你 会 看 
到 如 图 11-4 所 示 的 信息 。 

图 11-4 表 明 ，goCD 将 其 软件 包 自 身 标 识 信息 作为 其 文件 名 。 并 且 ， 从 文件 名 称 中 还 可 
以 获得 很 多 有 用 的 信息 。 例 如 ， 这 个 软件 的 名 称 、 发 布 年 份 与 月 份 、 小 的 修订 版 本 号 ， 以 
及 构建 号 和 对 应 的 操作 系统 。 

并 不 是 每 个 软件 都 必须 遵守 这 种 规则 ， 但 每 个 软件 都 应 该 定义 类 似 清晰 明确 的 规则 ， 
以 便 做 到 版 本 自 识 别 和 自 解释 ， 从 而 减少 沟通 成 本 ， 提 高 沟通 效率 。 
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Padele) PIPELINES ENVIRONMENTS AGENTS 


Pipeline Instance Stage Job 


Job Details | installers > 651VSM » dist/1 » Dist 
Ea dist 
固 deb 
国 go-agent_18.1.0-5649_all.deb 
国 go-server_18.1.0-5649_all.deb 
本 meta 
[| OSX 
国 go-agent-18.1.0-5649-osx.zip 
国 go-server-18.1.0-5649-osx.zip 


因 rpm 

国 go-agent-18.1.0-5649.noarch.rpm 

贺 go-server-18.1.0-5649.noarch.rpm 

固 win 

昌 go-agent-18.1.0-5649-jre-32bit-setup.exe 
园 go-agent-18.1.0-5649-jre-64bit-setup.exe 
国 go-server-18.1.0-5649-jre-32bit-setup.exe 
国 go-server-18.1.0-5649-jre-64bit-setup.exe 
BB zip 

国 go-agent-18.1.0-5649.zip 

四 go-server-18.1.0-5649.zip 


图 11-4 软件 包 的 命名 示例 

















2. 来 源 信息 

软件 包 的 来 源 信 息 主要 说 明 自 己 来 自 哪 里 ， 即 对 应 的 程序 代码 在 哪里 可 以 找到 , 通常 
对 应 于 源 代码 仓库 的 URI 地 址 、 分 支 名 和 RevisionID。 很 多 软件 甚至 会 将 其 在 代码 仓库 中 对 
应 的 RevisionID 直 接 包含 在 其 包 名 或 版 本 号 中 。 

例如 , 当 你 访问 goCD 自 身 的 持续 交付 管理 平台 https:/build.gocd.org 时 , 在 网 页 的 最 下 方 ， 
你 能 看 到 与 图 11-5 相 似 的 信息 。 其中, 在 “Go Version ”后面 的 信息 “18.4.0 (6600-f3e5401fb……… 
c3cdc62a28)” 就 是 该 软件 包 的 全 版 本 号 ， 其 格式 为 YYMMN(buildID-RevisionID)。YY 表 示 
年 份 ，MM 表 示 月 份 ，N 表 示 该 月 份 下 的 第 n 个 修订 版 本 。buildID 是 指 在 其 持续 交付 平台 上 
的 构建 编号 ，RevisionID 是 这 次 构建 在 代码 仓库 中 所 对 应 程序 代码 的 RevisionID 。 














Copyright © 2018ThoughtWorks, Inc. Licensed underApache License, Version 2.0. 





Go includesthird-party_software. Go Version: 18.4.0 (6600-f3e5401fb04e2e732835628b134bb6c3cdc62a28). 


图 11-5 GoCD 正 在 运行 的 软件 包 来 源 信息 





3. 依赖 关系 信息 

大 多 数 软 件 并 不 是 从 零 开始 构建 ， 而 是 越 来 越 多 地 利用 第 三 方 软件 包 ， 从 而 提升 开发 
软件 速度 。 这 也 直接 提高 了 软件 包 之 间 的 依赖 复杂 性 。 通 常 来 说 ， 软 件 包 之 间 的 依赖 关系 
有 3 种 ， 它 们 分 别 是 构建 时 依赖 、 测 试 时 依赖 和 运行 时 依赖 。 
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构建 时 依赖 (build-time dependency) 是 指 源 代码 构建 软件 包 的 过 程 需 用 到 的 第 三 方 软 
件 包 。 例如 在 开发 Java 应 用 程序 时 , 你 需要 CLASSPATH 中 的 依赖 项 来 编译 你 的 代码 。 这 种 
依赖 的 产生 是 由 于 在 程序 源 代码 中 引用 某 种 “外 部 的 类 或 方法 ”， 例 如 直接 调用 了 某 个 外 
部 包 中 提供 的 某 个 方法 ， 类 似 于 reference .call () 这 种 方式 。 

在 Java 世 界 里 ， 有 各 种 不 同 的 日 志 库 ,如 Apache log 和 、logback 和 SLF4j 等 。 其 中 SLF44 
提供 了 抽象 层 ， 真 正 提供 日 志 实 现 的 库 是 其 他 日 志 类 库 。 例 如 ， 当 应 用 程序 使 用 SLF4j 时 ， 
程序 文件 中 的 使 用 方式 如 下 所 示 : 

logger.debug ("Processing trade with id: {} and symbol : {} ", id, symbol); 

为 了 使 用 SLF4j，Classpath 不 仅 需 要 指向 SLF4 的 API jar 包 (如 slf4j-api-1.6.1.jar)， 而 
且 还 需要 有 你 所 用 到 的 日 志 实现 类 库 。 例 如 ， 如 果 你 使 用 Log4J 与 SLF4j 配 合 ， 那 就 需要 将 
下 面 3 个 Jar 文 件 (slf4j-api-1.7.21.jar、 slf4j-log4j12-1.7.21.jar、log4j-1.2.16.jar) 都 放 在 classpath 
的 搜索 路 径 中 。 此 时 ， 你 所 构建 的 软件 包 就 对 这 3 个 软件 包产 生 了 构建 依赖 。 

测试 时 依赖 (test-time dependency) 是 指 在 对 软件 包 进行 自动 化 测试 验证 时 所 需要 
依赖 的 软件 包 。 例 如 我 们 需要 用 到 的 自动 化 测试 框架 〈 如 JUnit) ， 以 及 其 他 测试 支持 工 
具 等 。 

运行 时 依赖 (run-time dependency) 是 指 软件 包 在 运行 时 所 需 依赖 的 软件 包 ， 这 些 依 
赖 包 通 常 必须 放 到 你 的 程序 可 以 找到 的 类 库 搜索 目录 (Classpath) 中 。C++ 语 言 的 .so 文件 
就 是 典型 的 运行 时 依赖 ， 它 不 会 被 包含 在 你 的 程序 中 ， 但 运行 时 必须 存在 。 

那么 ， 如 何 高 效 地 管理 这 些 依赖 呢 ? 


11.3 包 依赖 管理 


软件 包间 的 依赖 关系 是 其 与 生 俱 来 的 特点 ,“ 重 用 ”和 “便捷 性 ”就 是 这 种 依赖 关系 
的 源 动力 。 我 们 无 法 消除 依赖 ， 但 可 以 通过 一 些 管 理 办 法 ， 让 依赖 关系 的 负面 影响 尽 可 能 
少 一 些 。 如 何 才能 算是 做 好 了 软件 的 包 依赖 管理 呢 ? 一 个 简单 的 检验 标准 是 : 是 否 仅仅 只 
通过 检 出 源 代码 版 本 仓库 中 的 文件 (或 脚本 文件 )， 就 可 以 一 键 生 成 一 个 成 品 软件 包 。 

为 了 做 好 包 依 赖 管理 ， 我 们 应 该 从 显 式 声明 依赖 、 自 动 管理 依赖 、 减 少 复杂 依赖 3 方 
面 和 人 手 。 


11.3.1 显 式 声明 依赖 

显 式 声明 依赖 是 指 将 应 用 软件 在 不 同 环境 (例如 构建 环境 、 测 试 环境 、 预 生产 环境 或 
生产 环境 ) 中 所 需要 的 软件 包 以 及 相应 的 版 本 信息 ,通过 事先 约定 的 描述 方式 显 式 记录 在 
文档 (如 构建 脚本 ) 中 。 

大 多 数 高 级 软件 编程 语言 都 有 与 其 相应 的 软件 包 构 建 管理 工具 , 它们 通常 都 依赖 于 一 
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个 构建 描述 文档 。 软 件 所 需 的 包 依 赖 关系 就 按照 对 应 工具 的 指定 格式 描述 ， 保 存 于 该 项 目 
的 构建 脚本 中 。 例 如 ， 在 Java 项 目 中 ，Maven 工 具 使 用 的 默认 构建 脚本 是 Pom.xml，Gradle 
工具 使 用 的 默认 构建 脚本 是 build.gradle。 下 面 是 某 Java 项 目 用 Maven 来 管理 两 个 日 志 软 件 
包 的 依赖 声明 片断 : 


<dependency> 








<groupId>org.slf4j</groupId> 
<artifactId>slf4j-api</artifactId> 
<version>1.7.21</version> 

</dependency> 

<dependency> 
<groupId>org.slf4j</groupId> 
<artifactId>slf4j-log4j12</artifactId> 
<version>1.7.21</version> 


</dependency> 
其 中 显 式 指定 了 每 个 日 志 软 件 包 在 Maven 仓 库 的 唯一 标识 (groupld-artifactId-version)。 
测试 时 依赖 也 可 以 使 用 文本 方式 进行 描述 。 例 如 ， 对 Ruby on Rails 应 用 (简称 为 RoR 
应 用 ) 来 说 ， 可 以 使 用 Capstrano 这 种 部 署 管理 工具 来 管理 测试 时 依赖 。 下 面 是 某 RoR 应 用 
软件 的 部 署 文 档 片 断 ， 声 明了 测试 依赖 的 软件 包 : 














group :test do 
gem "rspec ", "~> 2.7.0" 
gem "rspec-rails", "~> 2.7.0" 
gem 'factory_girl', '4.2.0' 
gem 'factory_girl rails', '4.2.0' 
gem’ "minitest";, 5:10508 





gem 'mocha', '1.3.0' 
gem 'spork', '0.9.1' 
gem 'database cleaner', '~> 1.6.0' 





其 中 ,group :test 包含 一 组 软件 包 依赖 声明 , 说 明 该 应 用 软件 在 测试 环境 下 运行 自动 化 测试 ， 
需要 依赖 于 表 中 这 些 软件 包 ， 并 且 每 个 软件 包 都 显 式 指定 了 所 需 的 版 本 号 ,例如 其 自动 化 
测试 运行 所 需 软 件 包 rspec， 应 该 使 用 2.7.0 以 上 的 版 本 。 

当 我 们 把 声明 包 依赖 关系 的 文件 全 部 放 和 人 该 软件 自己 的 代码 仓库 以 后 , 将 其 作为 源 代 
码 进 行 管理 ， 就 实现 了 对 包 依 赖 关 系 的 版 本 管理 。 

到 目前 为 止 ， 我 们 已 经 建立 了 软件 与 其 所 依赖 的 软件 包 之 间 的 对 应 关系 ， 如 图 11-6 所 
示 。 那 么 ， 在 实际 工作 中 ， 如 何方 便 地 将 它们 联系 在 一 起 ， 并 高 效 地 应 用 起 来 呢 ? 
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X 产 品 代码 库 


源 代 码 
依赖 描述 文件 


软件 包 A: V1.0}------” -- 


1 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
工具 M: V45-------__ | 





Y 产 品 代码 库 


| 

| 

源 代码 | 
依赖 描述 文件 | 

| 








图 11-6 ”通过 描述 文件 引用 所 依赖 的 软件 包 








11.3.2 自动 管理 依赖 


在 我 们 通过 这 种 显示 声明 方式 对 包 依 赖 进行 描述 后 ， 当 我 们 构建 、 测 试 或 部 署 我们 所 
开发 的 软件 应 用 时 ， 只 要 有 工具 能 够 识别 包 依赖 描述 文件 中 的 信息 ， 帮 助 我 们 从 软件 包 仓 
库 中 自动 下 载 和 更 新 这 些 软件 包 就 可 以 了 。 例 如 ，Java 项 目 所 用 的 Gradle， 其 build.gradle 
文件 中 不 但 包含 包 依赖 关系 的 描述 ， 同 时 也 包括 软件 包 仓库 的 URI。 使 用 Gradle 的 














build.gradle 文 件 片段 如 下 : 


01. 
02., 
0353 
04. 
05 . 
06 . 
07 . 
08 . 
09 . 


apply plugin: 'java' 


repositories { 
maven { 
url "http://repo.mycompany.com/maven2" 
} 
} 
dependencies { 
compile group: 'org.hibernate', name: 'hibernate-core', 






version: 
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Os '3.6.7.Final' testCompile group: 'junit', name: 'junit', version: '4.+' 
下 下 入 runtime "org.groovy:groovy:2.2.0@jar" 
二 } 


从 这 段 构建 文档 中 ， 我 们 可 以 了 解 到 ， 有 一 个 公共 的 软件 包 仓 库 ， 其 访问 地 址 为 
http://repo.mycompany.com/maven2，Grade 将 在 这 个 仓库 中 查找 该 软件 应 用 所 需 的 依赖 包 。 
同时 , 该 文件 也 很 明确 地 展示 出 该 软件 所 需 的 源 代码 编译 、 测 试 编译 和 运行 时 的 依赖 包 及 
其 标识 。 

识别 这 类 依赖 描述 文件 并 帮助 我 们 自动 下 载 和 更 新 的 工具 也 是 一 种 软件 包 ， 因此, 我 
们 也 应 该 对 其 进行 版 本 管理 和 显 式 声明 。 正 如 图 11-6 中 的 工具 M 那 样 ， 我 们 将 该 软件 产品 
需要 使 用 的 依赖 管理 工具 的 描述 信息 也 放 到 了 该 产品 的 源 代码 仓库 中 , 而 对 应 的 软件 包 放 
到 了 软件 包 仓 库 之 中 。 

以 此 类 推 , 我 们 可 以 将 软件 产品 编 泽 、 构 建 、 测 试 中 所 用 的 工具 软件 都 按 这 种 方式 进 
行 管理 。 那 么 ， 我 们 就 基本 可 以 做 到 “只 要 从 源 代码 仓库 中 检 出 产品 项 目 代码 ， 就 可 以 一 
键 构建 出 一 个 完整 的 软件 产品 ”。 

使 用 这 种 管理 方式 以 后 ,即便 第 三 方 软件 私服 仓库 丢失 了 所 有 内 容 ， 只 要 我 们 保存 有 
源 代码 仓库 ， 我 们 仍旧 可 以 根据 源 文件 中 的 描述 信息 ,找到 我 们 需要 的 第 三 方 软件 信息 ， 
重新 建立 一 个 第 三 方 软件 私服 仓库 。 

与 Java 语 言 稍 有 不 同 ，C/C++ 项 目的 软件 包 由 两 部 分 组 成 ， 基 中 的 头 文件 被 用 于 编译 
和 链接 过 程 , 而 .so 动态 库 文件 被 用 于 运行 时 的 调用 。 谷歌 公 司 的 开源 软件 bazel 也 使 用 了 显 
式 声明 依赖 ， 例 如 在 处 理 编译 时 ， 需 要 先 做 依赖 关系 计算 ， 就 依赖 于 其 定义 的 BUILD 文件 
中 hdrs、srcs 和 deps 字 段 的 声明 。 


11.3.3 减少 复杂 依赖 


在 开发 应 用 程序 时 , 通常 都 会 使 用 现成 的 开发 框架 和 类 库 所 提供 的 功能 , 减少 工作 量 ， 
缩短 应 用 程序 上 市 的 时 间 。 这 就 像 在 盖 一 收 房 子 时 ， 我 们 会 从 供应 商 处 购买 已 经 生产 好 的 
门 和 窗 ， 而 不 是 自己 去 制造 。 然 而 ,这 也 是 软件 包 依赖 风险 产生 的 原因 。 简 单 依赖 关系 并 
` 会 带 来 太 大 的 风险 ， 例 如 软件 A 依赖 于 软件 包 B 和 C， 而 B 和 C 没 有 任何 依赖 。 但 是 ， 当 
依赖 关系 过 多 ， 且 具有 多 级 链条 依赖 ， 形 成 错综复杂 的 网 络 结构 时 ,依赖 关系 解析 就 会 变 
得 异常 困难 ， 甚 至 出 现 无 法 解析 的 致命 错误 。 

软件 包 仓库 管理 系统 除 软件 包 的 存储 和 检索 功能 以 外 ,最 好 能 够 提供 一 种 能 力 ， 即 可 
以 检查 每 个 软件 包 的 依赖 关系 ， 发 现 其 中 的 依赖 问题 、 风 险 与 隐患 ， 例 如 依赖 过 多 、 链 条 
过 长 、 依 赖 冲突 和 循环 依赖 等 问题 ， 并 提供 给 使 用 者 。 一 张 健康 的 依赖 关系 图 应 该 是 一 张 
有 向 无 环 图 ， 每 个 节点 应 该 是 软件 包 名 和 具体 版 本 号 的 组 合 。 
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依赖 管理 平台 


菜 大 型 互联 网 系统 ， 用 C/C++ 语言 开发 ， 由 千 人 共同 开发 、 构 建 和 维护 。 这 个 系统 
被 分 成 很 多 细小 的 服务 单元 (或 者 称 其 为 微服 务 )。 而 这 千 人 团队 也 被 分 为 多 个 小 团队 ， 
分 别 负责 其 中 的 数 个 服务 模块 。 不 同 服务 模块 的 开发 和 维护 周期 不 同 , 但 整个 系统 和 不 
同 小 团队 需要 协调 运作 。 因 此 ,企业 构建 了 一 个 软件 包 依 赖 管理 平台 ， 每 个 服务 模块 每 
次 发 布 前 ， 都 需要 在 这 个 配置 管理 平台 上 登录 模块 信息 ， 包 括 模块 名 、 模 块 的 3 位 版 本 
号 ( 形 如 A 1.1.1)、 交 更 的 特性 集 ， 以 及 它 所 依赖 的 上 游 模块 名 及 其 3 位 版 本 号 。 这 样 ， 
通过 这 个 平台 ， 就 可 以 查询 每 个 软件 包 的 依赖 关系 。 

如 图 11-7 所 示 , Engine 依 赖 于 两 个 Utl 包 (Histogram Utl 和 Pie Util ). 同时 , 软件 包 Printer 
和 Reporter 依 赖 于 Engine。 这 就 是 一 个 有 向 无 环 图 。 图 中 Engine 7.2.1 依 赖 于 Histogram Util 
2.1.1 和 Pie Util 4.2.1， 而 Reporter 的 3 个 版 本 (1.7.1，1.7.2 和 2.0.1 ) 都 使 用 了 Engine 7.2.1。 


Histogram_Util 
2 










Printer 








Engine 
区 





Pie_Util 
4.2.1 


图 11-7 有 向 无 环 依赖 图 





常见 的 包 依赖 问题 主要 有 3 大 类 别 ， 需 要 不 同 的 处 理 方式 ， 但 其 目标 都 是 尽 可 能 简化 
依赖 。 

1. 依赖 过 多 或 者 链条 过 长 

当 一 个 软件 包 依赖 于 过 多 软件 包 时 (如 图 11-8 所 示 )， 不 便于 软件 安装 部 署 ， 也 不 利 
于 平台 移植 。 当 你 安装 某 个 应 用 程序 时 ， 系 统 会 提示 你 先 安装 软件 包 A， 当 你 尝试 安装 A 
时 ， 系 统 又 提示 你 安装 软件 包 B。 这 种 长 链条 依赖 关系 可 以 通过 使 用 一 个 能 自动 解析 所 有 
依赖 关系 的 包 管理 器 来 解决 ， 例 如 很 多 操作 系统 的 默认 安装 包 管 理 器 都 具备 这 种 能 





























依赖 过 多 





ws BE 


图 11-8 ”依赖 过 多 或 链条 过 长 
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2. 依赖 冲突 

依赖 冲突 是 指 当 软件 包 A 和 软件 包 B 要 在 同一 机 器 上 运行 时 , 由 于 软件 包 A 依 赖 于 软件 
包 m 的 V1.1 版 本 ,而 B 依 赖 于 软件 包 m 的 V1.2 版 本 。 但 
是 ， 软 件 包 m 不 支持 在 同一 机 器 上 安装 两 个 不 同 的 版 
本 ， 这 就 出 现 了 依赖 冲突 ， 如 图 11-9 所 示 。 

解决 这 类 依赖 冲突 的 方式 有 两 种 。 

(1) 想 办 法 令 被 依赖 包 的 两 个 不 同 版 本 可 以 在 同 
一 环境 下 运行 。 这 种 依赖 冲突 在 Windows 的 旧版 本 的 
DLL 文件 依赖 关系 上 经 常 看 到 。 但 从 Windows 2000 后 ， 
引入 了 Windows 文 件 保 护 概念 ， 在 防止 应 用 程序 覆盖 
系统 自身 的 动态 链接 库 .dl 文件 以 外 ,还 鼓励 开发 人 员 使 用 自己 的 “专用 DLL”， 即 在 应 用 
程序 自己 的 目录 中 保存 DLL 的 一 个 副本 。 这 样 ,通过 Windows 路 径 搜 索 特 性 ( 即 先 搜索 本 
地 路 径 ， 再 搜索 系统 路 径 ) 使 得 应 用 程序 可 以 正常 运行 。 这 就 相当 于 把 应 用 程序 及 其 所 
有 依赖 的 软件 包 打 包 成 一 个 整体 ， 部 署 到 运行 环境 中 二 使 其 与 其 他 程序 不 共享 任何 软件 
包 。 目 前 支持 这 种 打包 方式 的 软件 还 有 Pants。 它 是 Twitter 开 源 出 来 的 一 个 构建 工具 ， 专 
门 为 那些 代码 规模 较 大 且 代 码 量 增 长 迅速 的 代码 库 服务 。 这 种 代码 库 通常 有 多 个 子 项 目 ， 
且 子 项 目 间 共 享 大 量 的 代码 ， 有 较 复 杂 的 第 三 方 依赖 库 *- 而 且 使 用 了 多 种 语言 、 代 码 生 
成 器 和 框架 。 它 通常 将 代码 库 及 其 所 有 依赖 打包 成 二 个 文件 z 在 部 署 时 只 需要 拿 到 这 个 
文件 ， 就 可 以 开 包 即 用 。 例 如 ， 它 可 能 将 Python 写 的 代码 及 其 所 有 依赖 包 打 包 成 一 个 PEX 
文件 。Pants 目 前 支持 Java、Scala、 Python、C/C++、Go、 JavaScript/Node、 Thrift、Protobuf 
和 Android 代 码 。 

(2) 打 平 依赖 。 也 就 是 说 ， 通 过 对 产品 代码 的 修改 ， 使 A 和 B 依 赖 于 m 的 同一 个 版 本 。 
例如 ， 将 图 11-9 中 的 软件 包 A 对 mV1.1 的 依赖 升级 ， 修 改 为 依赖 mV1.2。 

3. 循环 依赖 

如 果 软 件 包 A 依 赖 于 软件 包 B， 且 必须 在 B 的 某 个 特定 版 本 下 才能 运行 ， 而 软件 包 B 又 
反 过 来 依赖 于 A, 并 且 也 必须 运行 于 A 的 某 个 特定 版 本 下 ， 
那么 此 时 , 无 论 升 级 任何 其 中 一 个 软件 包 ， 都 会 破坏 另 一 
软件 包 ， 如 图 11-10 所 示 。 

解决 这 类 依赖 问题 的 方式 也 有 两 种 。 

(1) 分 裂 依赖 。 对 软件 包 A 和 B 进 行 分 析 和 改造 ， 令 i 
其 分 裂 出 一 个 或 多 个 依赖 子 包 , 使 得 原 有 的 软件 包 分 别 依 
赖 于 分 离 出 来 的 子 包 ， 从 而 打破 循环 ， 形 成 链 式 ， 如 图 11-11 所 示 。 虽 然 图 中 是 从 A 包 中 分 
离 出 子 包 A.c， 但 实际 工作 中 ， 也 可 能 是 从 B 包 中 分 离 出 另 一 个 子 包 ， 甚 至 重新 划分 A 和 B 两 























图 11-9 依赖 冲突 
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个 包 ， 或 者 将 二 者 合并 。 这 需要 根据 程序 代码 的 实际 业务 逻辑 来 确定 。 





图 11-11 通过 拆 分 方式 解决 循环 依赖 





(2) 每 次 升级 时 使 用 梯 型 升级 法 。 也 就 是 说 ， 先 用 
软件 包 B V5.1 来 构建 软件 包 A 的 新 版 本 V1.3， 再 用 A 的 
V1.3 来 构建 B 的 新 版 本 ， 成 阶梯 状 交 替 升 级 。 如 图 11-12 
所 示 。 

在 11.1.3 市 中 , 软件 运行 栈 被 分 为 3 个 层次 , 从 上 到 
下 分 别 是 “应 用 软件 层 ”“ 标 准 软件 层 ” 和 “基础 操作 
系统 层 ” 。 到 目前 为 止 ， 本 章 的 前 半 部 分 讨论 了 应 用 软 
件 层 的 包 管 理 ， 接 下 来 讨论 软件 运行 栈 下 面 两 层 〈 标 准 
软件 层 与 基础 操作 系统 层 ) 的 包 管 理工 作 。 图 11-12 ” 梯 型 升级 法 


11.4 ”环境 基础 设施 管理 


基础 操作 系统 层 与 标准 应 用 层 是 应 用 软件 运行 的 基础 上 下 文 ， 也 称 为 环境 基础 设施 ， 
变更 频率 低 是 它 的 特点 。 根 据 配 置 管理 的 第 一 原则 “一 切 绽 有 版 本 ”"， 我 们 同样 需要 对 其 
进行 版 本 管理 。 这 部 分 管理 需求 随 着 持续 交付 和 DevOps 的 发 展 而 逐渐 变 强 。 近年 来 相关 支 
撑 工 具 的 发 展 ， 也 使 其 愈加 受到 认可 和 重视 。 


11.4.1 ”环境 准备 的 4 种 状态 


在 传统 管理 方式 下 ,大 多 数 公司 的 正式 生产 环境 都 由 专门 的 运 维 团队 负责 。 对 于 正式 
环境 中 服务 器 数量 较 大 的 公司 ,这 些 人 会 隶属 于 同一 部 门 ， 如 技术 运营 部 门 (简称 运 维 部 
门 )。 由 于 服务 器 多 且 业 务 复杂 ， 正 式 生 产 环 境 的 管理 也 会 分 属于 两 种 不 同 角色 ， 他 们 分 
别 是 系统 运 维 角色 和 应 用 运 维 角色 。 其 中 系统 运 维 人 员 负 责 基 础 操作 系统 层 ， 应 用 运 维 人 
员 负 责 软 件 应 用 层 ， 而 标准 软件 层 则 视 运 维 内 容 的 不 同和 运 维 工作 强度 的 不 同 ， 可 能 归属 
其 中 的 任何 一 方 ， 甚 至 一 分 为 二 ,标准 软 件 包 的 安装 归 系 统 运 维 角色 人 负责， 而 对 标准 软件 
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包 的 定制 配置 由 应 用 运 维 角色 负责 。 

随 着 产品 业务 的 升级 和 基础 设施 技术 的 不 断 发 展 , 环境 准备 的 工作 内 容 与 工作 方式 也 
在 不 断 变化 ， 其 大 体 可 以 分 为 4 种 状态 。 

(1)“ 蛮 充 ": 以 “人 脑 + 手工 ”为 代表 。 

(2)“ 规 范 化 ": 以 “文档 + 私有 脚本 ”为 代表 。 
(3)“ 标 准 化 ”: 以 “办 公 自 动 化 ”为 代表 。 
(4)“ 自 动 化 ”: 以 “ 受 控 式 自动 化 脚本 ”为 代表 。 

1. 以 人 脑 + 手 工 为 代表 的 “蛮荒 状态 ” 

软件 组 织 刚刚 起 步 时 ， 其 环境 部 署 通 常会 处 于 手工 作坊 阶段 。 软 件 并 不 复杂 ， 用 户 
和 客户 数量 不 多 。 运 维 工作 并 不 是 公司 在 这 一 时 期 的 重要 关注 点 。 这 一 阶段 的 特点 有 以 
下 两 个 。 

(1) 开发 人 员 自 己 就 可 以 搞定 所 有 与 软件 部 署 相关 的 问题 。 

(2) 所 有 与 环境 准备 相关 的 知识 都 存在 于 个 别 骨 干 开发 人 员 的 头脑 中 。 他 们 是 团队 的 
核心 ， 环 境 部 署 的 “英雄 ”。 

2. 以 文档 + 私有 脚本 为 代表 的 “规范 化 状态 ” 

随 着 软件 服务 的 成 功 ,用户 和 客户 数量 变 多 ,更 多 的 软件 需求 像 漫 天 雪花 一 样 习 了 过 
来 。 服 务 器 数量 也 因为 请 求 数量 的 增长 而 增长 ， 环 境 维护 王 作 变 得 多 了 起 来 。 

此 时 ,团队 骨干 可 能 忙 不 过 来 了 ， 必 须 将 这 种 重复 性 工作 分 离 出 去 。 于 是 ， 团 队 就 开 
始 有 专人 来 负责 这 类 工作 ， 即 运 维和 人 员 。 这 一 阶段 有 以 下 儿 个 主要 表现 。 

(1) 要 求 正 式 的 上 线 部 署 文档 。 通 常会 总 结 出 一 个 环境 准备 指导 说 明 书 。 每 次 软件 部 
署 上 线 时 ， 开 发 人 员 也 会 提交 一 个 上 线 操作 说 明 ， 详 细 写 明 软 件 的 上 线 步 又 ， 交 由 运 维 人 
员 来 执行 。 例 如 ， 前 面 表格 中 所 示 的 那个 后 台 服 务 系统 准备 文档 虽然 有 11 个 大 步骤 ， 但 每 
一 个 步骤 中 包含 很 多 子 步骤 ， 它 的 完整 版 本 有 十 几 页 文档 。 该 团队 很 可 能 是 众多 初创 企业 
困 队 中 在 软件 工程 管理 方面 做 得 还 算 不 错 的 。 然 而 ， 现 实情 况 是 ， 在 很 多 团队 中 ， 你 甚至 
根本 找 不 到 这 样 一 个 环境 准备 说 明文 档 。 即 便 找到 了 ， 也 很 可 能 是 一 个 过 时 的 文档 ,无 法 
使 用 。 

每 当 软 件 新 版 本 更 新 时 ， 运 维和 人员 总 是 要 求 软件 开发 团队 提供 一 份 软件 更 新 步 又 文 
档 ， 而 且 必须 清楚 明确 ， 一 字 不 漏 。 此 时 开发 人 员 的 常见 做 法 就 是 : 将 上 次 写 好 的 文档 修 
订 一 下 ， 交 给 运 维 人 员 。 

(2) 要 有 规范 化 的 上 线 部 署 流程 。 在 这 个 阶段 ， 运 维 工 作 的 特点 是 通过 人 工 流 程 建立 
协作 秩序 ， 并 详细 记录 每 次 的 操作 记录 ， 如 图 11-13 所 示 。 
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单 次 操作 记录 


日 期 | 操作 人 | 操作 模块 操作 记录 (与 基准 模块 的 差异 ) 





一 周 不 一 致 汇总 


模块 基准 模块 与 基准 模块 差异 

















图 11-13” 运 维 操作 记录 表单 


(3) 利用 私有 化 脚本 ， 提 升 个 人 效率 。 在 这 一 过 程 中 ， 随 着 公司 的 发 展 ， 功 能 不 断 丰 
富 ， 我 们 也 需要 对 软件 服务 不 断 地 升级 。 每 次 升级 中 ， 都 会 重复 之 前 升级 过 程 中 的 一 些 动 
作 。 具 有 脚本 编写 能 力 的 运 维 人 员 就 会 自发 地 用 shell 脚 本 语言 (或 者 其 他 脚本 语言 ) 将 其 
编写 成 自动 化 执行 脚本 。 

每 次 软件 更 新 部 署 时 ， 选 择 其 中 某 些 脚本 文件 来 执行 。 每 次 可 能 都 需要 打开 文件 编译 
器 ， 修 改 其 中 的 一 些 配 置信 息 (因为 每 次 的 版 本 更 新 内 容 不 同 )， 再 执行 它 。 在 执行 这 些 
脚本 执行 的 过 程 中 ,， 运 维和 人员 可 能 会 偶尔 停 下 来 , 手工 检查 一 下 这 些 脚 本 的 执行 结果 是 否 
正确 ， 然 后 继续 执行 后 续 步 又 。 这 已 经 大 大 降低 了 运 维 人 员 的 劳动 强度 。 这 些 脚本 通常 由 
运 维和 人 员 个 人 保存 ， 是 方便 个 人 工作 的 工具 ， 并 没有 完全 被 纳入 组 织 资产 ， 放 入 代码 版 本 
控制 仓库 中 进行 版 本 管理 。 人 员 转 岗 后 ， 这 些 信息 和 工具 可 能 就 丢失 了 。 

通常 这 在 运行 机 器 少 、 环 境 不 复杂 、 发 布 频率 低 的 场景 下 是 适用 的 ， 也 是 早期 运 维 人 
员 的 重要 工作 方式 。 

现在 ， 还 是 有 很 多 企业 仍旧 处 于 这 个 状态 ， 如 图 11-14 所 示 。 行 业内 非常 重视 上 线 过 
程 的 流程 和 操作 合 规 性 ， 但 现状 是 没有 技术 手段 支撑 ,大 多 数 是 手工 操作 ， 开 发 人 员 和 运 
维 人 员 都 很 痛苦 ， 整 个 上 线 周 期 很 长 ， 还 非常 容易 出 问题 。 


ee er ewe ee) rs]) oP DT) em 


3 个 月 2~3 个 月 
图 11-14 ” 某 金融 企业 的 上 线 流程 示意 医 


新 版 本 开发 结束 后 ， 开 发 人 员 为 了 部 署 上 线 ， 先 要 准备 一 堆 文 档 (操作 步 又 要 完全 机 
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械 化 地 按 步骤 复制 粘贴 ， 就 能 完成 部 署 的 状态 ) 。 写 文档 用 了 半 个 月 ， 然 后 所 有 人 开会 评 
审 ， 接 下 来 演练 ， 反 复 进 行 好 多 次 ， 最 后 才能 上 线 。 

这 一 阶段 面临 以 下 几 个 挑战 。 

(1) 流程 通过 “人 ”来 维护 ， 经 常 有 遗漏 。 

(2) 文档 通过 “邮件 ”跟踪 ， 查 找 不 方便 。 

(3) 审计 工作 量 大 。 由 于 手工 工作 量 大 ， 常 有 人 绕 过 流程 。 
(4) 自动 化 脚本 不 规范 统一 ， 而 且 经 常 出 错 ， 导 致 部 署 过 程 中 断 。 

3. 以 办 公 自 动 化 为 代表 的 “标准 化 状态 ” 

随 着 软件 的 成 功 ， 公 司 也 不 断 发 展 壮大 ， 运 维 组 织 的 人 数 也 越 来 越 多 ， 生 产 环境 上 的 
部 署 事 件 也 多 了 起 来 。 于 是 ， 加 强 运 维 管控 的 呼声 越 来 越 高 ， 随 着 一 批 运 维 开发 工程 师 的 
进驻 ， 一 个 运 维 自动 化 平台 应 运 而 生 。 

此 时 的 “自动 化 平台 ”通常 以 “无 纸 化 办 公 ” 的 形态 出 现 ， 即 将 原来 在 线 下 填写 的 上 
线 步 又 文档 变 成 了 在 Web 页 面 上 填写 并 保存 的 表单 ， 名 日 “自动 化 提单 ”"。 实 际 上 ,是 将 前 
面 的 程序 化 广告 产品 录入 系统 部 署 文档 和 运 维 操作 记录 表格 进行 电子 化 。 

有 一 些 做 得 比较 好 的 运 维 办公 自 动 化 平台 , 能 够 将 其 中 一 些 简 单 的 步骤 通过 某 种 自 定 
义 的 语言 进行 自动 化 脚本 处 理 ， 使 之 可 以 自动 执行 。 但 对 那些 相对 复杂 的 操作 ， 仍 旧 需 要 
开发 人 员 在 Web 表 单 上 使 用 文字 的 方式 进行 描述 ， 由 和 运 维 大 员 按 照 步骤 手工 执行 。 

其 标准 化 的 另 一 个 表现 是 原来 所 有 的 规范 全 面 固化 到 平台 上 ， 成 为 具体 的 执行 标准 。 
运 维 人 员 不 用 自己 跑 到 开发 人 员 那 里 去 确认 ， 只 要 在 Web 平 台 上 查看 ， 合 格 就 点 击 “ 确 认 
接 单 ”， 不 合格 就 点 击 “ 拒 绝 接 单 ”， 并 附 上 留言 。 开 发 人 员 就 会 接 到 一 个 平台 通知 ， 到 平 
台 上 来 重新 修改 ， 再 提单 。 图 11-15 就 是 一 个 办 公 自 动 化 运 维 平 台 的 界面 示意 图 。 

办 公 自 动 化 运 维 平台 的 好 处 有 以 下 儿 个 。 

。 流程 在 平台 固化 。 软件 开发 团队 与 运 维 团队 之 间 的 互动 协作 统一 在 同一 个 平台 上 ， 





















































协作 流程 受 控 。 
。 部 分 内 容 的 标准 统一 。 例 如 简单 的 部 署 操作 可 以 通过 模板 配置 方式 由 平台 自动 化 
执行 。 


e 可 以 部 分 重用 。 通 过 各 种 配置 方式 ， 减 少 工作 量 。 

。 审计 工作 比较 容易 。 所 有 信息 保存 在 平台 上 。 

这 个 阶段 仍旧 存在 如 下 一 些 挑战 。 

e 由 于 系统 部 署 还 有 很 多 比较 复杂 的 操作 ， 仍 旧 需 要 人 工 参 与 。 

e 两 次 上 线 部 署 差异 对 比 仍旧 相对 困难 。 虽 然 开发 人 员 每 次 提交 上 线 单 时 ,都 可 以 复 
制 一 份 以 前 用 过 的 上 线 清 单 ， 但 是 每 次 上 线 清单 都 被 保存 在 平台 本 身 的 数据 库 中 ， 
每 个 上 线 清 单 都 是 一 个 独立 的 副本 , 这 样 就 保存 了 很 多 重复 的 信息 , 而 且 要 想 对 比 
两 次 上 线 部 署 的 差异 ， 必 须 登 录 到 平台 上 ， 通 过 人 工 肉眼 对 比 的 方式 查找 。 
































11.4 环境 基础 设施 管理 195 








法 OP 
RD 全 本 人 ED 
PM 全 于 人， ED 


损 作 9 时 间 : | 2011-03-08 14:59:45 


庆 洽 开始 时 间 : | 2011-03-08 15:02:50 
陆 计 续 率 时间 : | 2011-03-09 15:04:22 
同步 平台 : | 无 
程 诬 痢 要; 无 
者 洋 : im_bs 
上 二 步 雪 ; 王政 部 委 home/work/opbin/bin/cfmod -c /home/work/imbs/conf/imbs_strategy.conf -u "USER_SMM_LON:1 -m 


USER_8MM_ON:user 词 裕 是 否 为 襄 适 词 聂 ” 


现 壬 : im_bs 
改革 下 玉 ftp:/fte-im-rd313.tc.baidu.com/home/work/bmm_user_data.bct 
县 的 /home/work/imbs/data/pla_ comryVbmm_user_databd 





辐 ”同步 环境 Env5ync 四 Peee ma 同步 : Running 攻 

一 数 郁 : Finished @@ 
a 

WW i Padage We 程序 ; Finished 多 

i 模块 ; Not Started 昌 
A - 

Wg 远程 部 署 Deploy EnvSync | Package 配置 : Not Started @ 

司 局 动 服务 Activation 。 biel Gd Deploy 状 考 ; Not Started 外 

”服务 检查 Checklist 。 各 dr 仙人 Po Activation ma 








图 11-15 办公 自动 化 运 维 平台 示意 图 

4. 以 受 控 式 自动 化 脚本 为 代表 的 “自动 化 状态 ” 

这 一 阶段 的 典型 特点 是 由 平台 管理 自动 化 脚本 ， 即 所 有 自动 化 脚本 都 是 公司 资产 ,被 
平台 记录 和 保存 。 这 一 阶段 的 自动 化 运 维 脚本 有 两 种 形态 。 一 种 是 以 操作 过 程式 为 主 ， 另 
一 种 是 以 状态 声明 式 为 主 。 操 作 过 程式 脚本 是 最 传统 的 自动 化 脚本 ， 通 过 模拟 手工 执行 步 
又 的 自动 化 命令 执行 。 其 主要 特点 是 : 在 同一 个 环境 下 ， 自 动 化 脚本 被 多 次 执行 ， 每 次 执 
行 后 的 环境 状态 可 能 不 一 致 ， 或 者 出 错 。 状 态 声明 式 脚 本 是 指 在 脚本 中 指定 环境 的 目标 状 
态 ， 由 定义 该 状态 声明 规范 的 平台 执行 这 个 脚本 。 其 特点 是 : 在 同一 个 环境 下 ， 无 论 该 自 
动 化 脚本 被 执行 多 少 次 ， 每 次 执行 完成 后 的 环境 状态 都 是 一 致 的 ， 这 就 是 所 谓 的 “ 徊 等 操 
作 ”。 老 等 (idempotence) 是 一 个 计算 机 学 概念 ， 竹 等 操作 的 特点 是 一 个 程序 任意 多 次 执 
行 所 产生 的 影响 均 与 一 次 执行 的 影响 相同 。 

过 程式 脚本 的 益处 有 以 下 两 点 。 

e 符合 原 有 的 思考 习惯 ， 只 要 将 原来 的 手工 操作 步骤 用 脚本 语言 实现 即 可 。 

e 灵活 。 无 论 想 做 什么 样 的 操作 ， 几 乎 只 要 手工 操作 可 以 办 到 的 ， 基 本 上 这 种 过 程 

式 脚本 都 能 办 到 ， 不 受 任何 约束 。 
其 不 足 之 处 在 于 : 需要 花费 较 多 的 管理 精力 。 你 必须 知道 两 件 事 , 一 是 在 执行 脚本 前 ， 
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系统 的 原 有 状态 是 什么 样子 的 ， 二 是 执行 脚本 到 底 做 了 哪些 具体 操作 。 而 且 ， 在 同一 环境 
下 多 次 执行 同一 自动 化 脚本 ， 其 最 终 可 能 使 环境 处 于 一 种 “未 知 ”状态 。 
状态 声明 式 脚 本 的 益处 有 以 下 两 点 。 
e 可 以 明确 地 知道 ， 无 论 在 何 种 情况 下 ， 无 论 谁 执行 了 这 个 脚本 ， 系 统 最 后 都 会 到 
达 同 一 种 状态 。 
e 如 果 将 其 放 在 代码 仓库 ， 通 过 版 本 diff 功 能 ， 就 可 以 直接 对 比 两 次 环境 部 署 的 差 
异 点 。 
当然 ， 目 前 这 种 方式 也 有 其 不 足 之 处 ， 具 体 有 以 下 两 点 。 
e 学 习 成 本 高 。 事 实 上 ， 这 种 状态 声明 式 语法 就 是 一 种 DSL (Domain-Specific 
Language， 领 域 专属 语言 )， 用 于 描述 环境 部 署 领 域 的 专 有 操作 和 状态 。 
e。 当 这 种 声明 式 文本 数量 较 多 时 ， 文 件 管理 上 也 同样 存在 困难 。 例 如 ， 作 为 代码 文 
件 ， 它 并 没有 类 似 于 高 级 编程 语言 那 种 集成 开发 环境 ， 重 构 和 调试 相对 比较 困难 。 
这 类 状态 声明 式 工具 目前 比较 主流 的 包括 Puppet、Chef、Ansible 和 SaltStack。 这 4 款 工 
具 都 是 GitHub 上 的 开源 项 目 ， 也 有 商业 版 本 。 截 止 到 2017 年 12 月 ， 它 们 的 评分 数 如 表 11-2 
所 示 。 



















































































表 11-2 ”各 款 工具 在 GitHub 上 的 评分 























工 具 Watch 数 Star 数 Fork 数 
puppetlabs/puppet 501 4778 1958 
chef/chef 432 5137 2132 
saltstack/salt 582 8374 3908 
Ansible 1788 27218 9776 

这 4 种 工具 的 运行 模式 稍 有 不 同 ， 可 分 为 “ 拉 模 式 ”(pull) 和 “ 推 模式 ”(push)。 


。 “ 拉 模 式 ” 的 特点 是 在 目标 机 器 上 必须 事先 安装 有 客户 端 (agent)， 并 保持 与 服务 
器 端的 连接 “心跳 。 目 标 机 器 上 的 客户 端 向 控制 端 服务 器 发 出 请 求 命令 ， 服 务 器 
将 相关 的 部 署 信息 打包 发 给 目标 机 器 , 由 目标 机 器 在 本 机 执行 。Puppet 和 Chef 属 于 
这 种 工作 模式 。 
。 “ 推 模 式 ” 是 指 目标 机 器 并 不 需要 事先 安装 有 客户 端 ， 只 要 在 控制 端 设 置 目标 机 
器 列表 并 给 予 目 标 机 器 的 权限 , 控制 端 就 可 以 将 环境 部 署 要 求 发 送 到 目标 机 器 上 ， 
并 在 目标 机 器 上 完成 环境 部 署 工作 。Ansible 和 SaltStack 都 属于 推 模式 。 
除 此 之 外 , 还 有 一 类 应 用 部 署 工具 (如 Capstrano 或 Fabric) 通常 被 用 于 软件 应 用 层 〈 即 
第 三 层 ) 的 部 署 工作 。 这 类 工具 通常 为 由 特定 编程 语言 编写 的 应 用 程序 的 部 署 提供 便捷 性 。 
如 Capstrano 采 用 了 “习惯 约定 优 于 配置 ”的 设计 思想 ， 对 于 使 用 Ruby On Rails 框 架 开发 的 
Web 应 用 程序 更 加 友好 。 
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11.4.2 ”领域 专属 语言 的 应 用 


上 面 这 些 工 具 都 定义 了 各 自 工具 的 领域 专属 语言 , 使 用 这 种 语言 可 以 写 出 一 个 描述 所 
需 环境 部 署 状 态 的 文本 文件 。 这 个 文件 可 以 由 自动 化 工具 本 身 解释 并 自动 化 执行 ， 同时 它 
也 是 用 户 友 好 的 ， 即 具有 很 强 的 易 读 性 。 下 面 以 Puppet 和 Ansible 为 例 加 以 说 明 。 

首先 , 我 们 以 自动 化 工具 Puppet 管 理 apache2 服 务 为 例 来 简要 说 明 一 下 。 下 面 是 环境 配 
置 文件 的 部 分 内 容 : 








0E, 5 

02. class apache2 { 

3 exec { 'apt-update': 

04. command => '/usr/bin/apt-get update' # command this resource 


will run 


05;; } 

06. 

07. package { 'apache2 ' : 

08 . require => Exec['apt-update'], # require 'apt-update' 


before installing 
09 . ensure => installed， 


2: service { 'apache2': 


入 人 ss ensure => running, 


17. node ' host1 . example . com ' { 

18. include apache2 

19.5. "小 

2:03 

其 中 ， 第 2 行 到 第 15 行 的 作用 就 是 : 声明 一 个 apache2 的 服务 类 ， 并 定义 该 服务 首先 执 
行 命令 “apt-get update”， 然 后 安装 apache2 ， 并 确保 apache2 服 务 启 动 并 运行 。 第 17 行 到 第 
19 行 表示 在 主机 hostl.exmaple.com 上 安装 刚刚 定义 好 的 apache2 服 务 。 





Ansible 的 语法 如 下 : 

(0 

02. - hosts: webservers 
03:; Vars: 

04. http_port: 80 
OB:s max_clients: 200 


06 . remote user: root 
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07. tasks: 
08. - name: ensure apache is at the latest version 
09., yum: pkg=httpd state=latest 

10. - name: Write the apache config file 

template: src=/srv/httpd.j2 dest=/etc/httpd.conf 
notify: 


- restart apache 


service: name=httpd state=started 
handlers: 


- name: restart apache 








1 

2 

3 
14. - name: ensure apache is running 
5 

6 

Be 

8 


service: name=httpd state=restarted 


以 上 信息 表示 在 名 为 webservers 的 机 器 上 ， 安 装 httpd (apache 的 服务 名 ) 的 最 新 版 本 ， 
并 将 /srv/httpd.j2 的 文件 作为 该 服务 的 配置 文件 ， 复 制 到 /etc/httpd.conf， 并 用 该 文件 作为 新 
的 配置 文件 ， 重 新 启动 apache Web 服 务 。 

我 并 不 打算 在 这 里 讲解 每 种 工具 的 具体 用 法 ,但 从 以 上 两 个 编排 文件 的 例子 可 以 看 
出 ， 每 个 编排 工具 都 定义 了 各 自 的 领域 描述 语言 ， 并 县 功能 都 很 强大 ， 使 用 方便 。 这 种 根 
据 具 备 领 域 专属 语言 的 自动 化 规范 与 个 人 自行 编写 的 shelL 自 动 化 脚本 有 什么 不 同 呢 ? 

这 类 工具 已 经 定义 了 面向 环境 准备 的 领域 专属 语言 编程 脚本 通常 以 描述 意图 为 目标 
( 即 环境 准备 好 后 ， 系 统 应 该 处 于 什么 样 的 状态 ) ,这样 所 有 人 编写 的 脚本 都 要 共同 遵循 
相同 的 业务 领域 规范 ， 降 低 了 这 些 脚 本 的 理解 难度 和 代码 维护 的 复杂 度 ， 更 加 便于 知识 交 
流 和 知识 传递 。 


11.4.3 ”环境 基础 设施 即 代码 


现在 , 我 们 可 以 将 环境 基础 设施 的 一 系列 准备 工作 以 脚本 方式 描述 出 来 ,并 能 够 通过 
自动 化 的 方式 来 执行 这 些 脚本 。 对 工程 技术 人 员 来 说 , 环境 基础 设施 不 再 是 一 堆 插 着 网 线 
的 机 器 ， 而 是 “可 编程 环境 ”了 。 这 就 是 通常 所 说 的 “环境 基础 设施 即 代码 。 这 样 做 的 
好 处 在 于 : 
。 无 论 哪 类 环境 (构建 、 测 试 、 生 产 ) 出 了 问题 ， 我 们 都 可 以 快速 自动 化 地 构建 出 
一 个 全 新 的 环境 ; 
。 只 要 获得 授权 ， 任 何人 都 可 完成 这 项 任务 ， 不 需要 他 人 帮助 ; 
e 任何 对 环境 的 修改 都 可 以 被 记录 和 审计 ， 
e 对 不 同 环境 来 说 ， 只 要 将 其 代码 描述 进行 对 比 ， 就 可 以 了 解 它们 的 差异 ， 而 无 须 
登录 到 实际 的 主机 上 查看 。 
为 了 获得 以 上 收益 ， 环 境 基础 设施 的 版 本 管理 应 该 包含 : 
e 操作 系统 名 称 、 版 本 号 、 补 丁 版 本 号 以 及 系统 级 的 配置 信息 ， 












































11.$ 软件 配置 项 的 管理 199 








e。 软件 包 所 依赖 的 所 有 中 间 件 层 的 第 三 方 软件 系统 及 其 对 应 的 版 本 号 ， 以 及 对 其 的 
配置 信息 性; 

。 需要 与 应 用 程序 进行 交互 的 外 部 服务 及 其 版 本 号 ， 以 及 其 所 需要 的 配置 信息 。 

以 上 3 点 都 涉及 软件 自身 的 配置 信息 , 我 们 接 下 来 就 着 重 讨论 一 下 软件 配置 项 的 管理 。 


11.5 ”软件 配置 项 的 管理 


在 本 节 中 ,我 们 讨论 的 “软件 配置 项 ”是 指 软件 构建 时 或 运行 于 不 同 环 境 中 时 ,通过 
设 定 这 些 配 置 项 所 对 应 的 不 同 具体 值 ， 软 件 能 够 产生 不 同 的 行为 。 


11.5.1 二进制 与 配置 项 的 分 离 


一 个 软件 包 通 常 由 二 进 制 文件 包 与 配置 项 组 成 。 二 进 制 文件 包 通 常 由 源 代码 编译 打包 
而 成 ， 作 为 一 个 整体 ， 一旦 生成 即 保持 不 可 变 。 在 构建 过 程 中 ， 可 能 会 将 其 所 依赖 的 其 他 
软件 包 (有 人 也 常 称 其 为 “ 库 ” 或 “组 件 ") 以 某 种 方式 集成 到 最 后 生成 的 二 进 制 文件 中 。 
虽然 部 分 脚本 语言 所 形成 的 程序 并 不 需要 “编译 ”这 一 步骤 , 但 是 ， 只 要 将 其 作为 最 终 产 
物 ， 提供 一 组 相关 的 功能 集 ， 即 可 视 为 一 个 不 可 分 割 的 整体 。 

配置 项 是 独立 于 二 进 制 文件 的 一 组 可 配置 变量 。 依 据 每 个 配置 项 的 不 同 取 值 ， 二进制 
文件 包 可 在 不 同 的 运行 环境 中 运行 ， 并 可 外 ee 本 为。 配置 项 通常 以 不 同 的 形 
态 存在 ， 二 进 制 文件 包 可 以 从 配置 文件 、 数 据 库 表 、 环境 变量 ， 或 者 进程 启动 参数 中 
获取 这 些 配 置 项 的 具体 信息 。 

对 其 中 任何 配置 项 的 修改 , 都 会 形成 由 二 进 制 文件 包 和 新 的 配置 项 集合 构成 的 新 的 二 
元 组 ， 成 为 一 个 新 的 部 署 包 。 因 此 ， 无 论 是 产品 源 代 码 变更 上 线 ， 还 是 系统 配置 项 变更 上 
线 ， 我 们 都 可 以 将 其 看 作 是 一 次 部 署 操作 ， 如 图 11-16 所 示 。 


























配置 项 





针对 某 类 环境 的 
定制 化 参数 


某 类 运行 环境 
图 11-16 二进制 与 配置 项 的 分 离 示例 
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当 我 们 将 二 进 制 文件 包 与 配置 项 分 离 时 ， 即 可 实现 只 需要 构建 一 次 ,在 部 署 流水 线 的 
不 同 阶段 即 可 重复 使 用 的 目的 。 这样 可 以 确保 我 们 在 部 署 流水 线 不 同 阶段 所 验证 的 二 进 和 
文件 包 是 完全 相同 的 ， 只 是 由 于 运行 环境 的 不 同 而 使 用 取 值 不 同 的 配置 项 。 


11.5.2 配置 信息 的 版 本 管理 


在 软件 包 的 构建 和 运行 时 ， 需 要 不 同 的 配置 信息 。 根 据 配置 项 的 内 容 不 同 ， 可 以 分 为 
以 下 3 类 。 
e 环境 配置 项 (environment configuration): 该 类 配置 项 的 对 应 值 与 其 所 运行 的 环境 
相关 ， 且 常 与 环境 本 身 的 定义 相互 绑 定 。 例 如 其 所 用 到 的 域名 (或 IP 地 址 )、 其 与 
其 他 系统 或 服务 通信 的 服务 地 址 与 端口 号 等 。 
e。 应 用 配置 项 (application configuration) : 该 类 配置 项 与 信息 安全 控制 及 应 用 程序 自 
身 相关 。 例 如 账号 密码 、 初 始 分 配 内 存 的 大 小 、 数 据 库 连接 池 大 小 、 日 志 级 别 等 。 
同时 ， 也 包括 程序 自身 的 配置 项 ， 例 如 ， 在 使 用 Spring 框架 的 Java 项 目 中 ， 根 据 不 
同 的 目的 加 载 不 同 的 ApplicationContext,xml， 从 而 使 用 不 同 的 Bean。 
e 业务 配置 项 (business configuration ) : 该 类 配置 项 与 应 用 程序 所 执行 的 业务 行为 相 
关 ， 每 一 配置 项 设置 有 默认 值 。 例 如 ， 最 常见 的 功能 特性 开关 ， 或 者 电 商 系统 中 
的 商品 定价 策略 调整 等 。 
根据 使 用 时 机 的 不 同 ， 可 以 将 这 些 配 置 项 分 成 构建 时 、 部 署 时 和 运行 时 配置 。 构 建 时 
和 部 署 时 配置 相当 于 静态 变量 ， 通 常 是 与 环境 相关 的 一 些 配置 。 运 行 时 配置 就 是 一 些 可 以 
动态 调整 的 参数 ， 程 序 会 根据 不 同 的 参数 值 产生 不 同 的 行为 ， 通 常 是 与 技术 性 能 表现 相 
关 的 参数 〈 如 缓存 大 小 ) ， 或 者 是 与 业务 策略 相关 的 参数 ， 如 折扣 参数 比例 等 ， 如 图 11-17 
所 示 。 
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构建 时 
(静态 配置 ) 


部 署 时 
(静态 配置 ) 


运行 时 
(动态 配置 ) 





| 数据 源 地 址 
环境 类 | 注册 中 心地 址 ! 
1 配置 中 心地 址 1 
证人 ed he. Ee eB a 
应 用 类 Spring 的 application.xml 账号 密码 Token 许 可 证 ' 缓存 大 小 
Sh dt ed i ds ey ee dd eee Td 
| 折扣 策略 
业务 类 ! ”红包 开关 


图 11-17 配置 的 分 类 











通常 不 建议 在 构建 时 注入 环境 配置 信息 。 因 为 在 构建 时 将 不 同 环境 下 的 不 同 配置 信息 
注入 二 进 制 包 ， 将 使 得 程序 本 身 与 环境 配置 都 被 包含 在 这 个 二 进 制 文件 包 中 。 如 果 因 为 环 
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这 不 同 ， 而 需要 不 同 的 配置 项 时 , 就 需要 为 新 的 环境 重新 编译 打包 , 无 法 满足 “一 套 程序 ， 
多 环境 部 署 ” 的 要 求 ， 这 也 就 无 法 确保 “所 有 环境 中 所 测试 的 二 进 制程 序 前 后 一 致 ， 质 
量 风险 会 有 所 增加 。 同 时 ， 灵 活性 也 会 打折 扣 。 

当 我 们 能 够 区 分 配置 信息 的 不 同类 别 时 ,， 即 可 定制 不 同 配置 项 的 版 本 管理 策略 。 对 于 
静态 配置 的 版 本 管理 可 以 使 用 源 代 码 方式 进行 管理 。 例 如 ， 某 互联 网 公司 的 一 个 后 台 服 务 
化 系统 ， 为 了 能 够 高 效 管理 所 有 配置 项 ， 防 止 在 整个 研发 流程 中 不 同 验证 环境 之 间 的 配置 
遗漏 , 我 们 将 相关 的 静态 配置 类 与 产品 源 代码 同 源 , 通过 不 同 Product 3 
的 目录 来 存储 不 同 环境 的 配置 信息 ， 如 图 11-18 所 示 。 











conf 








然而 ， 这 种 方法 无 法 完全 应 用 于 运行 时 的 动态 配置 项 。 dev 
通常 运行 时 的 动态 配置 项 自身 修改 比较 频繁 。 当 在 软件 运行 时 test 
对 其 进行 调整 后 , 软件 行为 也 会 随 之 变化 , 例如 有 一 些 系统 具 prod 
备 自动 扩容 和 缩 容 功能 , 其 本 质 上 也 是 一 次 配置 信息 变更 。 根 图 11-18 ”静态 配置 与 
据 软件 配置 管理 流程 的 要 求 , 我 们 需要 对 这 类 运行 时 配置 变更 产品 源 代码 同 源 


也 进行 版 本 管理 ， 以 便 进 行 审计 管理 ， 帮 助 问题 定位 。 此 时 ， 这 种 配置 信息 的 管理 通常 可 
以 通过 日 志方 式 或 者 配置 数据 库 (CMDB) 记录 ， 以 便 后 续 问 题 诊断 和 操作 审计 。 


11.5.3 配置 项 的 存储 组 织 方式 


目前 ， 用 于 存储 配置 项 的 方式 有 很 多 ， 最 简单 的 方式 是 使 用 文本 文件 。 例 如 ， 可 以 针 
对 每 一 类 运行 环境 写 一 个 文本 文件 ， 如 表 11-3 所 示 。 这 种 方式 的 好 处 在 于 比较 容易 做 版 本 
管理 ， 直 接 放 入 源 代 码 仓库 即 可 。 对 它 的 任何 变更 ， 都 必须 先 提交 到 代码 仓库 ， 这 样 就 能 
进行 审计 。 需要 注意 的 是 , 对 于 一 些 敏 感 信息 (如 密码 等 ) 不 能 与 源 代 码 放 在 同一 个 仓库 ， 
应 该 设置 单独 的 仓库 访问 权限 。 同 时 ， 也 不 能 直接 以 明文 方式 放 在 文件 中 ， 需 要 经 过 加 密 。 
这 种 存储 方式 的 不 足 在 于 ， 如 果 是 分 布 式 系统 ， 则 需要 在 不 同 节点 同步 该 配置 文件 ， 如 何 
保持 文件 的 一 致 性 和 同步 更 新 生效 是 一 个 比较 大 的 问题 ， 通常 需要 另外 有 一 个 分 发 系统 来 
帮助 完成 这 项 工作 。 






































表 11-3 ”配置 文本 文件 




















运行 环境 文 件 
共用 配置 global.cong.php 
开发 环境 dev.cong.php 
foo 机 房 foo.cong.php 
bar 机 房 bar.cong.php 
环境 映射 文件 ( 软 链 接 ) env.cong.php 








我 们 还 可 以 将 配置 项 信息 放 入 数据 库 、 文件 目录 服务 或 注册 表 中 ， 它 们 都 可 以 直接 远 
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程 访问 ， 而 且 安 全 权限 相对 容易 管理 。 但 其 不 足 在 于 对 配置 项 进行 修改 后 ， 需 要 团队 自己 
通过 某 种 方式 来 记录 这 些 变更 历史 ， 以 用 于 审计 管理 ， 以 及 问题 出 现 后 的 回 滚 操作。 
目前 ， 在 分 布 式 系统 管理 领域 ， 也 有 很 多 软件 可 以 提供 配置 中 心服 务 ， 如 ZooKeeper 
和 etcd 等 。 但 与 上 面 的 数据 库 、 文 件 、 目 录 服 务 和 注册 表 一 样 ， 所 有 这 些 服 务必 须 能 够 完 
成 配置 信息 的 版 本 管理 和 修改 记录 保存 的 功能 ， 才 能 满足 软件 配置 管理 的 基本 需求 。 


11.5.4 配置 漂移 与 治理 


在 生产 环境 中 有 一 类 常见 问题 ， 名 为 配置 漂移 (configuration drift) ， 它 是 指 随时 间 发 
展 , 由 于 各 种 未 预期 原因 而 做 出 的 配置 修改 引起 计算 机 或 软件 服务 偏离 了 我 们 所 希望 的 配 
置 状 态 。 这 种 漂移 通常 都 是 由 于 人 的 临时 修改 引起 的 ， 例 如 某 人 为 了 定位 问题 而 登录 到 蘑 
台 机 器 上 修改 了 服务 日 志 的 级 别 ， 但 结束 后 忘记 恢复 。 也 可 能 是 为 了 缓解 生产 环境 突然 出 
现 的 某 个 严重 问题 而 临时 调整 了 某 些 机 器 的 网 络 配置 。 当 发 生 配置 漂移 后 ， 常 会 使 生产 环 
况 处 于 某 种 不 确定 状态 ， 甚 至 会 导致 重大 生产 事故 。 

由 于 硬件 和 软件 上 下 线 数 量 庞 大 ， 配置 漂移 在 很 多 数据 中 心 都 会 遇 到 ,在 灾难 恢复 和 
高 可 用 性 系统 故障 中 ， 因 配置 漂移 产生 的 故障 占 绝 大 部 分 。 未 知 的 配置 漂移 现象 使 组 织 面 
临 数据 丢失 和 延长 中 断 的 高 风险 。 


配置 漂移 的 典型 场景 一 一 配置 修改 无 记录 


小 李 在 某 个 网 络 科技 公司 实习 6 个 多 月 了 ， 表 现 非 常 不 错 ， 经 常 受到 领导 的 表 杨 。 
就 在 两 个 月 前 ， 有 个 同事 离职 了 ， 需 要 将 他 手中 的 工作 进行 交接 。 其 中 有 一 项 工作 是 维 
护 某 个 访问 流量 一 直 不 是 很 大 的 内 容 网 站 。 于 是 ， 领 导 决 定 让 小 李 来 接手 这 项 工作 。 

由 于 本 身 的 工作 已 经 比较 多 了 ,小 李 接 手 过 来 以 后 并 没有 花 太 多 时 间 在 这 上 面 ， 只 
大 概 看 了 网 站 的 结构 ， 它 用 茶 个 J2EE 框 架构 建 , 一直 运行 比较 稳定 ， 只 是 最 近 访 问 量 在 
缓慢 上 升 。 为 了 应 对 流量 上 升 ,， 两 周 之 前 ,领导 让 运 维 部 门 给 这 个 网 站 分 配 了 一 台 性 能 
更 强劲 的 服务 器 。 

可 是 自从 将 这 个 网 站 迁移 到 这 台 服 务 器 以 后 , 该 网 站 每 隔 两 天 就 因为 性 能 问题 需要 
重新 启动 一 下 。 小 李 感 到 非常 奇怪 ,在 原来 的 服务 器 上 运行 还 很 稳定 ， 为 什么 到 了 新 的 
服务 器 上 却 要 经 常 重新 启动 一 下 呢 ? 查 看 了 一 下 最 近 几 天 的 用 户 访问 量 , 并 没有 较 大 的 
增长 。 当时 做 服务 迁移 时 , 是 按照 这 个 网 站 服务 安装 说 明 书 操作 的 。 由 于 工作 时 间 不 长 ， 
自己 没有 找到 原因 ， 就 发 了 一 条 微 信 给 前 同事 ， 问 是 否 知道 什么 原因 。 没 过 多 久 ， 前 同 
事 回 复 了 ， 短 信 只 写 了 一 句 : “启动 时 为 JVM 分 配 更 大 的 内 存 。” 

原来 在 前 同事 没有 离职 之 前 ， 因 为 流量 不 断 上 涨 ， 他 们 一 起 修改 过 原来 那 台 服务 器 上 
的 网 站 服务 启动 命令 ,将 JVM 内 存 调 高 ， 但 是 并 没有 任何 记录 ， 或 修改 原来 的 说 明文 档 。 


好 的 软件 配置 管理 流程 可 以 解决 配置 漂移 问题 。 例 如 ， 将 静态 配置 放 入 版 本 控制 库 ， 
并 禁止 直接 登录 到 主机 环境 修改 配置 信息 ， 只 能 提交 修改 到 代码 仓库 ， 并 通过 自动 化 方式 
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进行 生产 环境 中 配置 的 修改 ， 那 么 就 可 以 避免 由 于 人 为 操作 遗漏 造成 的 配置 漂移 。 还 有 一 
种 更 为 严格 的 方式 ， 那 就 是 “不 可 变 基础 设施 ”。 


11.6 不 可 变 基础 设施 与 云 应 用 


想象 一 下 ， 假 如 你 在 和 孩子 玩 搭 积木 时 ， 如 果 想 要 换 一 块 不 同 颜色 的 积木 ， 你 会 给 它 
重新 涂 颜 色 么 ? 当然 不 会 ， 你 只 需要 拿 到 你 想 要 的 一 块 积木 ， 把 它 换 上 就 可 以 了 。 不 可 变 
基础 设施 (Immutable Infrastructure) 就 像 是 一 块 积 木 ， 它 将 软件 运行 栈 的 3 个 层次 作为 一 
个 整体 来 看 待 。 当 需要 对 其 中 的 任何 一 层 进行 变更 时 ， 只 能 通过 整体 替换 〈 即 全 部 移 除 后 
再 增加 ) 的 方式 进行 ， 而 不 能 通过 对 其 中 某 一 层 的 内 容 直接 进行 更 新 或 修改 的 方式 进行 。 
作为 不 可 变 基础 设施 ， 必 须 满足 以 下 3 个 要 求 。 

(1) 系统 运行 环境 (包括 所 有 层次 ) 的 准备 均 以 自动 化 方式 完成 。 

(2) 一 且 完 成 准备 工作 ， 该 基础 设施 的 任何 一 个 层次 均 不 得 更 改 。 

(3) 如 果 因 为 某 种 原因 需要 对 该 系统 环境 进行 更 改 , 则 必须 使 用 另 一 个 不 可 变 系统 环 


























11.6.1 ”实现 不 可 变 基础 设施 


1. 物理 机 镜像 技术 和 虚拟 机 镜像 技术 

这 两 种 技术 均 可 以 用 来 提高 环境 准备 效率 。 我 们 可 以 利用 镜像 工具 (如 Full Automatic 
Installer、SystemImager 和 ISO 镜像 工具 ) 对 已 经 安装 好 的 应 用 程序 运行 环境 进行 镜像 备份 ， 
并 将 镜像 文件 保存 到 统一 的 镜像 仓库 中 。 在 需要 准备 一 个 与 原 有 系统 相同 的 运行 环境 时 ， 
可 以 直接 从 镜像 仓库 中 取出 该 系统 镜像 ， 部 署 到 一 台 宿 主机 上 ， 进 行 简单 配置 调整 后 ， 即 
可 立即 投入 使 用 。 

物理 机 镜像 技术 是 将 整个 物理 机 的 内 容 制 作成 镜像 文件 , 而 虚拟 化 技术 则 将 物理 机 的 
资源 分 配给 在 其 上 运行 的 多 个 虚拟 机 ， 尽 管 可 能 会 带 来 一 些 性 能 上 的 损失 , 但 其 资源 利用 
率 得 到 了 大 幅 提升 ， 同时 也 提高 了 环境 准备 的 便捷 性 。 物 理 机 镜像 与 虚拟 机 镜像 的 使 用 过 
程 如 图 11-19 所 示 。 






















镜像 文件 镜像 副本 
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图 11-19 物理 机 镜像 与 虚拟 机 镜像 的 使 用 过 程 
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例如 ， 一 个 简单 的 Web 应 用 程序 的 运行 环境 原本 需要 两 台 物 理 机 ， 分 别 是 Web 应 用 服 
务 器 和 数据 库 服 务 器 。 但 当 我 们 使 用 虚拟 机 技术 后 , 可 以 在 一 台 物 理 机 上 局 动 两 个 虚拟 机 ， 
分 别 运 行 Web 应 用 服务 器 和 数据 库 服务 器 ， 如 图 11-20 所 示 。 


Web 环 境 ”数据库 环境 











App A App B Web 环 境 数据 库 环境 
Web 环 境 数据 库 环境 Bins/Libs Bins/Libs App B 





AppA AppB 
Bins/Libs Bins/Libs 


Docker Engine 
硬件 硬件 


物理 机 虚拟 机 技术 Docker 容 器 技术 
图 11-20 ”不同 镜像 技术 的 差异 


将 每 个 虚拟 机 制作 成 相应 的 虚拟 机 镜像 文件 , 保存 到 虚拟 机 镜像 仓库 中 。 当 其 他 人 需 
要 同样 的 环境 时 ， 可 以 使 用 虚拟 机 环境 准备 工具 (如 Vagrant)， 运 行 已 编制 好 的 环境 编排 
文件 , 以 自动 化 的 方式 快速 准备 好 运行 环境 。 你 其 至 可 以 在 Vagrantup 提 供 虚 拟 机 仓库 服务 
公共 平台 中 找到 并 下 载 想 要 的 基础 运行 环境 ， 而 不 必 自 己 从 头 开 始 制作 。 

Vagrant 也 使 用 文本 文件 作为 虚拟 机 编排 的 描述 文件 ， 下 面 是 一 个 Vagrantfile 的 示例 : 


01. Vagrant.configure("2") do |config| 








mW 








02 . config.vm.box = "hashicorp/precise64" 
03 . config.vm.provision :shell, path: "bootstrap.sh" 
04. end 


第 2 行 声 明 使 用 公共 镜像 仓库 中 的 名 为 “hashicorp/precise64” 的 镜像 文件 ; 第 3 行 声 明 
在 该 虚拟 机 启动 后 运行 一 个 shell 脚 本 文件 ， 文 件 名 为 “bootstrap.sh”。 而 这 个 bootstrap.sh 
文件 与 Vagrantfile 同 在 一 个 目录 下 ， 其 内 容 为 安装 Apache 服 务 器 ， 并 将 /vagrant 目 录 链 接 到 
apache 的 Web 目 录 上 ， 代 码 如 下 : 

01. #!/usr/bin/env bash 

O02:, 


03. apt-get update 
04. apt-get install -y apache2 


05. if ! [ -L /var/www ]; then 
06. rm -rf /var/www 
QO ln -fs /vagrant /var/www 


08:,. :E+ 
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此 时 ， 只 要 执行 命令 vagrant up， 就 会 创建 你 所 需要 的 虚拟 机 ， 并 准备 好 Apache 





然而 ， 这 两 种 镜像 技术 对 于 我 们 所 说 的 代码 化 管理 并 不 容易 ， 它 们 通常 是 通过 手工 安 
装 基础 系统 ， 然 后 再 通过 工具 将 其 制作 成 镜像 。 如 果 需 要 对 已 有 的 镜像 修改 ， 变 更 成 本 相 
对 高 。 

2. Docker 容 器 技术 

虚拟 机 技术 是 在 宿主 操作 系统 (hostOS) 上 ， 运行 一 整套 客户 操作 系统 (guest OS ) ， 
而 Docker 则 是 一 种 更 轻 量 级 的 容器 技术 ， 它 利用 了 宿主 操作 系统 的 一 部 分 ， 而 不 是 重新 安 
装 一 套 客户 操 作 系统 ， 如 图 11-20 所 示 。 

Docker 自 2012 年 开源 以 来 ,得 到 了 迅速 发 展 。 它 通过 一 个 编排 文件 dockerfile 即 可 生成 
镜像 。 更 重要 的 是 ，Docker 镜 像 有 分 层 设 计 ， 即 新 的 镜像 可 以 在 底层 镜像 基础 之 上 进行 构 
建 。 下 面 这 段 代 码 就 是 在 操作 系统 Ubuntu 的 基础 镜像 之 上 ， 重 新 生成 一 个 安装 有 Nginx 服 
务 器 的 环境 。 其 dockerfile 内 容 如 下 : 


01. FROM Ubuntu:latest 
02. MAINTAINER Qiao Liang 











035 

04. RUN echo "deb http://archive.ubuntu.com/ubuntu/ raring main universe" >> 
/etc/apt/sources.l1ist 

Qs RUN apt-get update 

06. RUN apt-get install -y nano wget dialog net-tools 

07 RUN apt-get install -y nginx 

08. RUN rm -Vv /etc/nginx/nginx.conf 

09. ADD nginx.conf /etc/nginx/ 

10. RUN echo "daemon off;" >> /etc/nginx/nginx.conf 





11. EXPOSE 80 

二 CMD service nginx start 

第 1 行 表 示 ， 这 个 新 的 Docker 镜 像 以 镜像 仓库 中 Ubuntu 的 最 新 版 本 (latest) 为 基础 。 
Docker file 的 维护 人 是 Qiao Liang。 第 3 一 7 行 是 在 新 镜像 系统 中 的 sources.list 中 增加 包 源 ， 
并 安装 Nginx。 第 8~ 10 行 是 指定 Nginx 配 置 文件 的 内 容 。 第 12 行 是 启动 Nginx 服 务 。 

通常 ,镜像 给 我 们 带 来 的 好 处 是 其 不 可 变性 。 即 这 个 镜像 一 旦 生成 , 就 不 会 发 生变 化 。 
而 且 ， 只 要 用 于 生成 该 镜像 的 编排 文件 (如 上 面 的 代码 ) 不 变 ， 即 便 使 用 该 文件 多 次 执行 
镜像 生成 操作 ， 其 结果 也 应 该 是 不 变 的 。 

然而 ,在 上 面 的 这 个 dockerfile 里 , 仍旧 存在 镜像 可 发 生变 化 的 一 个 潜在 风险 ， 它 源 于 
编排 文件 的 第 一 行 ， 即 基础 镜像 版 本 。 在 第 一 行 中 ,我 们 指定 了 基础 镜像 是 Ubuntu 镜像 的 
最 新 版 本 。 假 如 在 第 一 次 生成 新 的 Nginx 镜 像 时 ，latest 版 本 指向 镜像 库 中 的 Ubuntu17.04 版 
本 , 由 于 最 新 版 本 的 Ubuntu 操作 系统 17.10 已 经 发 布 , 此 时 这 个 Ubuntu 基础 镜像 文件 的 管理 
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者 很 可 能 会 重新 建立 一 个 新 的 Ubuntu17.10 镜 像 ， 并 把 latest 指 向 这 个 17.10 镜 像 。 如 有 果 此 时 
我 们 再 利用 上 面 的 dockerfile 文 件 ， 重 新 生成 Nginx 服 务 镜像 ， 那 么 我 们 两 次 构建 所 用 的 基 
础 镜像 已 经 是 不 一 样 的 了 。 

如 何 修正 它 呢 ? 是 否 将 第 一 行 的 代码 改 为 From Ubuntu:17.04， 就 可 以 保证 两 次 
构建 的 Nginx 镜 像 完全 一 样 呢 ? 其 实 不 然 。 因 为 ,“17.04” 和 “17.10” 这 两 个 仅仅 是 给 基 
础 镜像 打上 的 标签 ， 而 Docker 的 标签 是 可 以 再 次 重用 或 重新 定义 的 。 因 此 ， 如 果 想 要 保证 
基础 镜像 的 不 可 变性 ， 最 好 使 用 该 镜像 的 唯一 标识 ， 即 生成 镜像 时 一 并 产生 的 一 个 散 列 字 
符 串 ， 这 和 我 们 将 代码 提交 到 Git 代 码 仓 库 时 生成 的 散 列 码 类 似 ， 它 是 全 局 唯一 的 。 

3 种 不 同 镜像 技术 实现 不 可 变 基础 设施 的 成 本 显然 是 不 同 的 。 成 本 最 高 的 当然 是 物理 
机 镜像 ， 虚 拟 机 技术 次 之 ，Docker 容 器 化 技术 的 成 本 相对 低 一 些 。 


11.6.2 云 原生 应 用 


随 着 云 技术 的 快速 发 展 与 普及 , 越 来 越 多 的 企业 将 其 软件 服务 放 到 了 云端 。 这 使 得 耗 
费时 间 和 精力 的 环境 基础 设施 准备 工作 得 到 了 大 大 的 简化 ， 同 时 有 利于 资源 的 有 效 利用 。 
在 研发 过 程 中 , 也 更 容易 构建 与 生产 环境 相似 的 测试 环境 。 例 如, 若 想 把 程序 部 署 到 Heroku 
(是 最 早出 现 的 PaaS (Platform As A Service) 提供 商 之 一 )- 二 ， 开 发 者 只 要 通过 git push 命 
令 ， 把 程序 推送 到 Heroku 的 Git 服 务 器 上 ， 它 就 会 自动 触发 安装 、 配 置 和 部 署 程序 。Heroku 
是 托管 式 服 务 ， 无 论 何 时 部 署 新 版 本 ，Heroku 都 会 构建 一 个 新 的 实例 ， 并 用 它 替 换 当前 运 
行 的 实例 。 这 类 软件 应 用 被 称 为 “ 云 原生 应 用 ”。 

作为 公有 云 PaaS 的 先驱 ，Heroku 公 司 于 2012 年 提出 了 “ 云 原生 应 用 ”的 12 要 素 ， 也 被 
称 为 12 原 则 ， 目 的 是 告诉 开发 者 如 何 利 用 云 平 台 提 供 的 便利 来 开发 更 具 可 靠 性 和 扩展 性 、 
更 加 易于 维护 的 云 原生 应 用 。 这 12 原 则 是 : (1) 一 套 基准 代码 ， 多 环境 部 署 ; (2) 显 式 声 
明 依 赖 关 系 ;(3) 在 环境 中 存储 配置 ，(4) 把 后 端 服务 当 作 附 加 资源 ，(5) 严格 分 离 构建 、 
发 布 和 运行 ，(6) 应 用 本 身 应 该 是 一 个 或 多 个 无 状态 进程 ， 进 程 之 间 没 有 数据 共享 ，(7) 
通过 端口 绑 定 提供 服务 ， (8) 通过 进程 模型 进行 扩展 ，(9) 快速 启动 和 优雅 终止 ，(10) 
尽 可 能 让 开发 环境 、 预 生产 环境 与 生产 环境 等 价 ;(11) 日 志 作 为 事件 流 ，(12) 将 管理 / 
管理 任务 作为 一 次 性 进程 运行 。 尽 管 这 些 原 则 带 有 Heroku 公 司 产品 宣传 的 痕迹 ， 但 其 核心 
仍旧 表明 了 一 种 有 利于 持续 交付 的 软件 架构 , 即 严格 分 离 软件 服务 本 身 与 该 服务 所 处 理 的 
数据 ， 从 而 更 加 容易 让 软件 的 部 署 与 发 布 都 基于 “不 可 变 基础 设施 ”。 对 云 原生 应 用 来 说 ， 
“不 可 变 基础 设施 ”就 是 小 菜 一 碟 了 。 


11.6.3 ”优势 与 挑战 


这 种 不 可 变 基 础 设施 方式 与 传统 的 环境 准备 工作 方式 相 比 ， 有 如 下 7 个 优势 。 
(1) 简化 运 维 工作 。 可 以 使 用 全 自动 方式 ， 用 新 版 本 组 件 替换 旧 组 件 ， 从 而 确保 系统 
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从 最 初 开始 一 直到 最 后 都 保持 “已 知 且 良好 ”状态 。 因 为 不 需要 跟踪 组 件 变更 ， 所 以 使 得 
维护 一 批 运行 实例 变 得 更 简单 。 版 本 回 滚 也 更 容易 ， 因 为 你 可 以 保存 或 重新 生成 旧版 本 的 
镜像 。 

(2) 部 署 流程 自 文档 。 当 完全 自动 化 部 署 时 ， 只 需要 创建 一 个 描述 性 文本 文件 , 说 明 
如 何 正 确 生 成 应 用 程序 的 运行 镜像 即 可 。 不 需要 编写 Word 文 档 , 而 是 准确 详细 的 部 署 应 用 
程序 的 自动 化 步骤 。 而 且 ， 随 着 时 间 的 推移 ， 这 个 自动 化 的 描述 性 文件 不 会 因为 玻 于 同步 
而 过 时 ! 因为 不 对 其 进行 修改 ， 就 无 法 进行 新 的 部 署 。 

(3) 持续 部 署 不 停机 ， 故 障 更 少 。 所 有 变更 都 可 以 由 源 代 码 管理 ， 通 过 部 署 流水 线 进 
行 跟踪 。 基 础 设施 的 每 一 项 变更 均 可 以 以 脚本 形式 进行 。 当 准备 好 新 的 不 可 变 基础 设施 以 
后 ， 直 接替 换 原 有 的 实例 。 

(4) 减少 错误 和 威胁 。 软 件 服务 建立 在 复杂 的 硬件 和 软件 栈 之 上 ， 随 着 时 间 的 推移 ， 
总 会 产生 一 些 错误 。 通 过 自动 化 替换 的 方式 而 不 是 修复 ， 实 际 上 ， 我 们 可 以 更 频繁 是 规律 
性 地 重新 生成 实例 。 这 样 可 以 减少 配置 漂移 ， 同 时 保持 或 提高 服务 水 平 协议 (SLA)。 

(5) 多 类 环境 基础 设施 的 一 致 性 。 虚 拟 化 和 容器 化 技术 使 得 我 们 在 开发 和 测试 环节 就 
能 够 以 更 廉价 的 方式 得 到 与 生产 环境 类 似 的 环境 基础 设施 ， 并 对 其 进行 验证 ， 从 而 减少 因 
测试 环境 与 生产 环境 过 多 的 差异 而 导致 的 生产 问题 。 

(6) 杜绝 了 “配置 漂移 ” 使 用 不 可 变 基础 设施 后 ， 三 层 软件 栈 被 作为 一 个 整体 使 用 。 
若 需 要 对 其 中 任何 信息 进行 修改 ， 就 要 重新 生成 镜像 。 

(7) 被 测试 的 即 是 被 使 用 的 。 一 旦 对 代码 或 配置 修改 完成 ， 就 会 立即 生成 不 可 变 的 基 
础 镜像 。 而 这 个 不 可 变 基础 镜像 会 经 过 整个 部 署 流 水 线 的 验证 ， 最 终 要 么 验证 出 质量 有 问 
题 被 抛弃 ， 要么 就 会 直接 被 放 入 生产 环境 使 用 。 可 以 确保 生产 环境 使 用 的 一 定 就 是 被 验证 
通过 的 镜像 。 

尽管 这 种 不 可 变 基础 设施 有 诸多 的 收益 , 但 它 也 不 是 免费 的 午餐 , 很 可 能 对 你 的 组 织 
来 说 是 一 个 巨大 的 挑战 。 例 如 : 

(1) 为 不 可 变 基 础 设施 建立 一 整套 自动 化 运 维 体系 在 初期 就 需要 较 高 的 成 本 。 

(2) 生产 环境 中 突 发 问题 的 修复 时 间 可 能 会 稍 长 。 因 为 在 这 种 模式 下 ,我们 被 禁止 直 
接 通过 SSH 连 接 到 当前 有 问题 的 服务 器 ， 马 上 动手 修改 它 。 只 能 修改 源 代码 (可 能 是 产品 
源 代码 或 者 配置 信息 )， 提 交代 码 库 ， 通 过 部 署 流 水 线 再 次 重新 生成 镜像 ， 最 后 部 署 上 线 。 

(3) 对 大 规模 软件 服务 来 说 , 将 大 尺寸 镜像 分 发 到 多 台 窒 主机 上 需要 消耗 大 量 的 网 络 
资源 ， 时 间 消 耗 也 会 不 少 ， 因 此 必须 有 相应 的 平台 工具 支持 。 例 如 ，Facebook 就 利用 
BitTorrent 协 议 实 现 大 尺寸 文件 的 传输 。 

(4) 有 状态 存储 的 软件 服务 并 不 容易 被 直接 替换 。 我 们 有 很 多 数据 保存 在 数据 库 中 ， 
而 且 数 据 库 中 的 数据 量 可 能 非常 巨大 。 因 此 ， 对 于 数据 库 实 例 ， 我 们 无 法 使 用 这 种 方式 进 
行 快 速 奉 换 。 
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11.7 ”数据 的 版 本 管理 


每 个 软件 都 要 处 理 数据 ， 对 数据 进行 版 本 管理 是 比较 困难 的 事情 。 但 是 ,我 们 仍旧 可 
以 通过 对 其 中 一 部 分 内 容 的 版 本 管理 ， 来 提高 产品 研发 流程 中 各 成 员 之 间 的 协作 效率 ， 例 
如 加 快 测试 环境 的 建立 ， 提 高 自动 化 测试 用 例 的 执行 可 靠 性 。 


11.7.1 数据 库 结 构 变 


如 果 你 使 用 关系 数据 库 系 统 , 当 软 件 部 署 频率 变 高 , 同时 参与 软件 开发 的 人 员 变 多 时 ， 
就 应 该 对 数据 库 结 构 进行 版 本 管理 。 除 审计 管理 与 问题 定位 以 外 ， 对 数据 库 结构 的 版 本 管 
理 在 开发 联 调和 自动 化 测试 中 也 非常 有 用 。 

从 软件 诞生 的 第 一 天 起 ， 每 当 关 系数 据 库 的 Schema 变更 ， 都 必须 撰写 一 个 增 量 SQL 
脚本 ， 并 且 将 其 放 到 源 代码 仓库 中 。 这 样 ， 通 过 Flyway 或 者 Liquibase 这 类 工具 就 可 以 进行 
数据 库 升 级 或 降级 操作 。GoCD 从 项 目 启 动 之 时 就 通过 这 种 方式 进行 数据 库 Schema 的 管理 ， 
如 图 11-21 所 示 。 





























1_create_initial_ tables,sql |2_create_indexes,sql J3_add\build_ignored_column.sql 
4_add_check_externals_column.sql |5_add from_external_colummrsql i)6_add_pipeline_label.sql 

| |7_add_pipeline_label_counters.sql |8_add_build_cause_buffer,sql [本 9-5dd_material_properties table.sql 

| j10_add_stage timestamp.sql |11_add_stage_order.sql 1l2%add,stage_result.sql 
|13_add_stage_approvalType.sq| |14_add_name_pipelineld_index foris,.. | |15_add_name_agentld_buildid_index... 


1_ 16_add folder to_materials.sql |17_correct_integrity_issues_in_stayesw. = 118_change_material_properties_valu... 


[19_change_material_url to_nvarchar... | |20_add_artifact_properties generator.. | |21_add_materialld to_modifications.... 
|_|22_remove_pipelineld from_modific... | |23_add_index for_stages.sql J24_add_columns for_dependency_... 
[25_change_length_of_revision_to_10..， | |26_add table fetch_artifact plans,sql | |27_set_not_null_on fetch_artifact_pl... 


28_drop_table fetch_artifacts.sql |29 fix_hsqldb_migration.sql |30_add_buildcause_message to_pip,.. 
31_add_user_setting,sql |32_add_email_ me_column.sql |33_add_unique_constraint to_name_... 
|_|34_add_changed_column_to_modifi.. | |35_rename usersettings table.sql |36_add_notificationfilters_table.sq| 
|37_make the_pipeline name_case_in... | |38_make the_stage_name case_inse,.. | |39_make the job_name_case_insens,.. 


40_undo_pipelines_case_insensitive_... | |41_add_builds_index_on_name_state,.. | |42_add_counter to_pipelines.sql 





43_alter_modifiedFiles fileName.sql Lj44_added_name_column_into_mater... 
图 11-21 通过 文本 脚本 保存 关系 数据 库 的 Schema 变更 

当 我 们 把 数据 库 结构 的 变更 脚本 也 放 到 源 代码 仓库 后 ,在 执行 自动 化 测试 时 ， 可 以 很 
方便 地 得 到 一 个 干净 的 初始 数据 库 。 如 果 一 个 发 布 给 客户 的 历史 版 本 出 现 缺陷 ,为 了 定位 
问题 而 需要 该 版 本 的 干净 数据 库 时 ， 你 就 可 以 从 源 代码 仓库 中 检 出 对 应 的 代码 版 本 ， 通 过 
这 些 脚本 重建 当时 的 数据 库 结 构 。 如 果 你 希望 将 一 个 历史 版 本 升级 到 最 新 版 本 ， 那 么 
Flyway 或 者 Liquibase 工 具 就 会 利用 这 些 脚 本 帮助 你 完成 这 样 的 工作 。 
11.7.2 ”数据 文件 

对 于 二 进 制 数 据 文件 的 版 本 管理 , 就 不 能 使 用 源 代码 版 本 控制 系统 了 。 此 时 可 以 通过 
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类 似 FTP、 远 程 文件 系统 的 方式 进行 管理 。 例 如 ， 某 公司 内 部 有 一 个 大 文件 存储 系统 。 你 
可 以 将 一 个 大 尺寸 文件 上 传 到 该 系统 中 ， 它 会 返回 一 个 URI。 然 后 ， 将 URI 放 到 一 个 文本 
文件 ， 将 文本 文件 放 入 源 代码 仓库 。 这 样 就 将 数据 与 产品 源 代码 进行 了 统一 的 版 本 管理 。 
此 时 的 URI 就 是 一 个 引用 ， 而 这 个 大 文件 存储 系统 就 相当 于 一 个 存储 数据 并 进行 版 本 管理 
的 共享 仓库 。 这 种 方式 对 于 测试 数据 的 管理 是 极其 重要 的 。 

还 有 另外 一 种 情况 。 当 应 用 程序 的 启动 或 运行 时 需要 依赖 一 组 数据 文件 ， 而 这 组 数据 
文件 是 通过 对 一 个 静态 数据 集 应 用 一 些 规则 算法 动态 生成 的 。 此 时 ,我们 只 要 将 数据 集 当 
作 二 进 制 文件 ， 而 将 规则 算法 的 代码 脚本 保存 于 源 代 码 仓库 ， 也 同样 可 以 达到 对 其 进行 
本 管理 的 目的 。 


11.8 需求 与 源 代码 的 版 本 关联 


到 目前 为 止 ， 我 们 对 图 11-1 中 的 代码 、 软 件 包 、 环 境 都 进行 了 版 本 和 管理。 那么， 如果 
想 要 代码 与 需求 项 进行 关联 , 应 该 如 何 处 理 呢 ? 虽然 在 很 多 情况 下 , 这 并 不 是 一 个 强 需 求 ， 
但 如 果 想 做 ， 还 是 可 以 实现 的 。 

我 们 可 以 将 需求 文档 进行 归档 , 并 与 对 应 的 软件 包 版 本 相关 联 。 如 果 需 要 更 细 粒 度 的 
管理 ， 也 可 以 将 需求 管理 平台 中 的 每 个 需求 条 目 ID (或 缺陷 管理 系统 的 缺陷 ID) 与 代码 进 
了 关联 。 例 如， 在 每 次 向 代码 仓库 提交 代码 时 ， 将 需求 条 目的 ID 作 为 代码 提交 注释 的 一 部 
分 , 并 将 这 种 关联 信息 展示 出 来 。 图 11-22 给 出 的 是 敏捷 项 目 管理 工具 Mingle 与 代码 仓库 关 
联 以 后 的 展示 图 ， 其 中 4341a2 是 代码 仓库 中 的 修订 版 本 号 ， 而 #14216 是 需求 管理 平台 上 该 
需求 对 应 的 需求 标识 。 














1Y 








History Murmurs”* 


CHANGESETS Choose changeset to view: master GO © Help 


Current Path: 


Path Age Most Recent Committer Most Description 
Recent 
Changeset 
NOTICE 4 days mdoerken 9c8934 final notice file and eula for 13.1 release 
<mdoerken@thoughtworks.com> 
app 3 days smarker #14216 | [Objective API] Events : Changed feed title based on 
<smarker@thoughtworks.com> Telverable 








了 config 4 days smarker 
<smarker@thoughtworks.com> 


11-22 工具 Mingle 与 代码 仓库 的 关联 示意 图 


339489 #14216 - [Objective API] Events : Added program feeds controller. 
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民 好 的 软件 配置 管理 是 打造 持续 交付 部 署 流 水 线 、 加 速 持续 验证 环 的 基础 支撑 。 本 章 
讨论 了 软件 配置 管理 的 3 个 核心 原则 。 
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(1) 对 一 切 进 行 版 本 管理 。 
(2) 共享 唯一 受信 源 。 
(3) 标准 化 与 自动 化 。 
可 以 用 下 面 5 个 问题 来 验证 检查 你 是 否 对 一 切 都 做 了 版 本 管理 。 
(1) 产品 源 代码 和 测试 代码 是 否 放 入 了 版 本 控制 系统 。 
(2) 软件 应 用 的 配置 信息 是 否 放 入 了 版 本 控制 系统 。 
(3) 各 类 环境 的 系统 配置 是 否 放 入 了 版 本 控制 系统 。 
(4) 自动 化 的 构建 和 部 署 脚本 是 否 放 入 了 版 本 控制 系统 。 

(5) 软件 包 是 否 进行 了 版 本 管理 。 

另外 ， 你 也 可 以 用 下 面 两 个 问题 来 检查 软件 配置 管理 是 否 做 得 足够 好 。 

(1) 只 要 从 源 代码 仓库 中 检 出 产品 源 代码 仓库 , 就 可 以 一 键 式 自动 化 地 构建 出 完整 软 
件 包 吗 ? 

(2) 在 没有 他 人 的 帮助 下 , 任何 团队 成 员 都 可 以 一 键 式 自动 化 搭建 出 一 套 应 用 软件 系 
统 ， 用 于 体验 产品 新 功能 吗 ? 
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前 面 的 几 章 中 ， 我 们 主要 讨论 了 快速 验证 环 中 构建 阶段 的 工作 。 通 过 在 业务 需 

十 ;yfe 流 各 软件 配置 管理 、 持 续集 成 与 自动 化 测试 等 多 方面 的 管理 改进 ， 缩 

短 研发 质量 反馈 时 间 ， 提 升 软件 应 用 的 研发 速度 。 在 本 章 中 ， 我 们 将 主要 讨论 如 何 高 频 低 
风险 地 进行 软件 部 署 和 发 布 ， 尽早 让 软件 在 生产 环境 中 运行 ， 如 图 12-1 所 示 。 

















提问 构建 
价值 探索 AA 快速 验证 ， 1 
钳 定 BA \ 
精炼 ”决策 \ I A 

共 创 监测 


图 12-1 快速 验证 环 的 部 署 与 运行 


快速 验证 环 的 部 署 与 运行 的 主要 内 容 包括 高 频 发 布 的 背后 动机 与 收益 , 降低 发 布 风险 
的 相关 方法 如 蓝 绿 部 署 、 金 丝竹 发 布 (或 灰 度 发 布 ) 和 暗部 署 (dark launch) ， 支 撑 高 频 发 
布 的 相关 技术 手段 如 开关 技术 、 数 据 迁移 方法 、 抽 象 分 支 策 略 等 。 


12.1 高 频 发 布 是 一 种 趋势 


自 2001 年 “敏捷 宣言 ”诞生 以 来 ， 一 直 明 痢 暗 诵 ，2007 年 以 前 ， 国 内 对 “敏捷 软件 开 
发 ”的 认同 度 并 不 高 。 甚 至 某 些 传统 IT 企业 说 :“ 我 们 不 需要 那么 快速 地 交付 软件 ， 敏捷 ” 
不 适合 我 们 。” 相 反 ， 互 联网 公司 则 说 :“ 敏捷 ”两 周 发 布 一 次 ， 太 慢 了 ， 不 适合 我 们 。” 
直到 2009 年 ，Flickr 的 John Allspaw 和 Paul Hammond 在 Velocity2009 年 的 大 会 上 分 享 了 题目 
为 《Flickr 每 天 部 署 10 次 以 上 : 开发 与 运 维 的 高 效 合作 》 的 报告 ， 让 业界 同仁 眼前 一 亮 。 
原来 ， 软 件 发 布 还 可 以 这 么 快 ! 
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12.1.1 互联 网 企业 的 高 频 发 布 


现在 , 世界 领先 的 互联 网 公司 都 在 以 “频繁 发 布 ” 的 模式 更 新 它们 的 软件 产品 。 例 如， 
早 在 2011 年 5 月 ,亚马逊 公司 的 月 度 统计 数字 表明 , 平均 每 11.6 秒 就 触发 一 次 软件 部 署 操作 ， 
当月 最 高 部 署 频率 达到 每 小 时 1079 次 之 多 。 平 均 1 万 台 服 务 器 会 同时 收 到 部 署 请 求 ， 而 最 
高 一 次 是 3 万 台 服 务 器 同时 执行 一 个 部 署 操作 。 

在 2017 年 ，Facebook 公 司 每 天 对 其 网 站 推送 多 次 部 署 ， 如 图 12-2a 和 图 12-2b 所 示 。 而 
其 移动 应 用 客户 端 每 周 向 应 用 市 场 推 送 一 次 , 其 研发 流程 如 图 12-2c 所 示 , 每 天 面向 内 部 员 
工 发 布 最 新 的 内 部 全 员 体验 版 本 ， 并 且 面 向 十 万 和 百 万 用 户 推送 Alpha 版 和 Beta 版 。 








推送 间 限 每 日 推送 次 数 开发 中 {一周} 开发 中 【一周 ) 
25 4 Biooding version Blooding version 
| 0 bo 
2 .0 ED GD OO 
至 mm 6 ， 4 
_ 4 Blooding version Aiph Beta Pro 
有 一 ER 二 2 自动 化 而 104 百 方才 户 全 同 用 
FSCSRWSE 日 日 1 站 ll over days 
(a) (b) (c) 


图 12-2 ”Facebook 的 部 署 及 发 布 
(资料 来 源 : Chuck Rossi 在 @Scale Conference 2017 上 发 表 的 “Rapidielease at massive scale”) 


当然 ， 这 些 发 布 中 并 不 全 是 功能 发 布 ， 当 然 也 会 包含 缺陷 修复 。 例 如 ， 根 据 2013 年 
Dror G. Feitelson 、Kent L. Beck 等 发 表 的 “Development and Deployment at Facebook” 一 
文 ， 图 12-3 中 展示 了 Facebook 公 司 网 站 每 日 发 布 的 内 容 分 布 。 我 们 可 以 看 出 ， 其 中 有 50% 
与 问题 修改 相关 。 





重大 修复 






用 户 测试 / 
度量 数据 


内 部 使 用 


视觉 修复 
图 12-3 ”Facebook 网 站 的 部 署 内 容 分 布 


那 是 否 表明 网 站 质量 堪忧 呢 ? 根据 Chuck Rossi、Kent Beckd 在 “Continuous Deployment 
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of Mobile Software at Facebook” 一 文中 所 述 ， 随 着 部 署 频率 的 提升 ， 以 及 总 代码 量 和 提交 
次 数 的 提高 ， 严 重 缺 陷 数 量 并 没有 随 之 升 高 ， 如 图 12-4 所 示 ( 横 轴 是 每 个 月 的 代码 提交 次 
数 ， 纵 轴 是 生产 环境 上 发 现 的 缺陷 数 )。 尽 管 严重 程度 为 中 级 和 低级 的 缺陷 数量 有 所 上 升 ， 
但 考虑 到 开发 人 员 数 量 的 增长 、 网 站 系统 复杂 度 的 提升 以 及 公司 对 待 软件 质量 的 观点 ， 这 
是 Facebook 公 司 可 以 接受 的 程度 。 
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图 12-4 ”Facebook 公 司 不 同 严 重 级 别 的 问题 数量 与 Android 和 iOS 每 月 提交 次 数 的 函数 关系 


Etsy 是 一 家 以 手工 制品 交易 为 主 的 P2P 电 商 。2014 年 ， 它 有 约 60 万 的 月 活跃 用 户 量 和 
每 月 15 亿 的 页 面 浏 览 量 ， 销 量 为 19 亿 美元 。2017 年 ， 商 品 销售 额 达到 32 亿 美元 。 在 第 2 章 
中 ， 我 们 介绍 了 他 们 的 工作 哲学 ， 即 “持续 试验 。 该 公司 自 2009 年 底 开始 全 面 转向 持续 
交付 模式 。 在 此 之 前 ， 他 们 使 用 的 是 瀑布 开发 模式 。 当 时 部 署 发 布 操作 的 特点 是 “ 慢 、 复 
杂 、 高 度 定制 化 ”， 而 2010 年 后 ， 部 署 操 作 的 特点 是 “ 快 、 简 单 、 一 致 "， 如 表 12-1 所 列 。 


表 12-1 2010 年 Etsy 实 施 持续 部 署 前 后 的 对 比 


















































对 比 项 2010 年 前 2010 年 后 
每 次 部 署 时 间 需要 6 一 14 小 时 的 停机 时 间 进 行 部 署 15 分 钟 (配置 变更 少 于 5 分 钟 ) 
每 次 部 署 人 力 一 个 专门 负责 部 署 的 团队 1 人 
总 本 部 署 是 全 公司 第 一 优先 级 任务 ， 高 度 计 、 
部 署 频率 划 且 频率 很 低 30 次 /天 (2012)，50 次 /天 (2014) 
代码 贡献 者 人 数 N/A 170+ 人 (2012) 
创建 发 布 分 支 
准 库 结构 变 Ne 
pi 使 用 主干 代码 
/的 各 雁 
部 署 时 的 步 又 打包 se 
分 发 、 部 署 ， 重 启 > > 
es 结束 
缓存 清理 
结果 








(资料 来 源 ，Mike Brittain 在 GOTO 2012 Conference 上 发 布 的 “Continuous Delivery: The Dirty Details”) 


Etsy 每 次 部 署 会 包含 以 下 内 容 。 
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(1) 应 用 软件 服务 新 增 了 一 个 类 或 方法 。 








) 
(2) 页 面 上 的 图 片 、 样 式 表 或 者 一 些 模板 文件 。 
(3) 内 容 变更 等 。 
(4) 修改 配置 开关 的 取 值 ， 或 者 灰 度 部 署 。 因 此 ， 每 次 发 布 既 可 能 是 对 线 上 问题 进行 


快速 响应 〈 例 如 修复 安全 风险 、 功 能 缺陷 、 限 流 、 降 载 或 者 增 减 节 点 )， 也 可 能 是 修改 了 
软件 配置 项 ， 发 布 补丁 等 。 


12.1.2 收益 与 成 本 共存 


在 高 频 发 布 模式 中 , 每 次 发 布 的 内 容量 通常 都 会 少 于 在 低频 发 布 中 每 次 发 布 的 内 容量 
(显然 一 天 可 以 完成 的 功能 比 十 天 的 少 )。 为 什么 这 么 多 公司 都 在 向 “高 频 发 布 ” 这 个 方向 
迈进 呢 ? 高 频 发 布 的 收益 有 以 下 几 个 。 

(1) 有 更 多 的 机 会 与 真实 用 户 互动 ， 从 而 快速 决定 或 调整 自己 产品 前 进 的 方向 。 

(2) 由 于 每 次 变更 规模 较 小 ， 软 件 系 统 没 有 剧烈 的 变化 ， 从 而 降低 部 署 风 险 。 

(3) 单 次 部 署 成 本 降低 ， 且 趋 于 恒定 。 如 表 12-1 所 列 ，Etsy 在 使 用 大 版 本 发 布 模式 时 ， 
每 次 部 署 都 需要 花费 大 量 的 精力 与 时 间 ， 在 2010 年 执行 高 频 发 布 以 后 ,每 次 部 署 所 需 精力 
与 时 间 很 少 ， 且 基本 不 变 。 因 为 频繁 的 部 署 操作 会 令 大 感到 痛苦 、 就 会 有 动力 做 很 多 自动 
化 设施 建设 ， 从 而 减低 成 本 和 精力 。 

(4) 出 现 问题 易 定 位 、 易 修复 ， 且 能 够 快速 更 正 : 

具体 对 比如 图 12-5 所 示 。 
































部 署 风险 





时 间 时 间 


部 署 成 本 
缺陷 修复 成 本 





时 间 时 间 
图 12-5 ”高 频 发 布 与 低频 发 布 的 对 比 
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据 2017 年 DevOps 报 告 所 述 , 高 绩效 (high-performance) 的 团队 比 低 绩 效 (low-performance) 
团队 相 比 : 

(1) 其 代码 发 布 频率 高 出 46 倍 ; 

(2) 从 代码 提交 至 代码 部 署 所 用 时 间 缩 短 为 1/440， 

(3) 平均 故障 恢复 时 间 缩 短 为 1/96， 

(4) 变更 故障 率 降低 为 1/5。 

上 述 收益 来 自 成 熟 且 自 动 化 的 部 署 与 发 布 操作 。 如 果 仍 旧 坚 持 低 频 发 布 模式 所 用 的 研 
发 管理 方法 ， 则 强行 执行 高 频 发 布 会 带 来 较 高 的 迭代 成 本 。 例 如 ， 某 团队 原来 每 个 月 手工 
发 布 一 次 , 现在 决定 每 周 发 布 一 次 。 和 暂且 不 讨论 每 个 版 本 的 质量 验证 成 本 会 如 何 变 , 假设 
仍旧 采用 原 有 手工 模式 ， 那 么 每 月 的 工作 量 就 是 原来 的 4 倍 。 而 且 ， 在 发 布 周期 缩短 后 ， 
原来 工作 模式 中 并 不 占用 太 多 成 本 的 操作 (如 编译 时 间 、 测 试 工 作 强 度 等 ) 都 会 变 成 较为 
突出 的 矛盾 。 

然而 ， 无 论 怎 样 ， 我 们 都 无 法 100% 消 除 发 布 风险 。 我 们 要 做 的 是 不 断 寻找 降低 发 布 
风险 的 方法 。 


12.2 ”降低 发 布 风险 的 方法 


接 下 来 ， 我 们 就 分 别 讨 论 一 下 降低 发 布 风险 的 方法 ， 包 括 蓝 绿 部 署 、 滚 动 部 署 、 金 丝 
淮 发 布 〈 灰 度 发 布 ) 以 及 上 暗部 署 。 
12.2.1 蓝 绿 部 署 

蓝 绿 部 署 (blue-green deployment) 是 指 准备 两 套 完 全 一 致 的 运行 环境 ， 其 中 一 套 环 
党 作为 正式 生产 环境 ， 对 外 提供 软件 服务 。 另 一 套 环境 作为 新 版 本 的 预 生产 环境 ， 部署 软 
件 的 新 版 本 ， 并 对 其 进行 验收 测试 。 当 确认 没有 问题 后 ， 将 访问 流量 引流 到 这 个 新 版 本 所 
在 的 环境 中 ， 作 为 正式 的 生产 环境 ， 同 时 保持 旧版 本 所 在 环境 不 变 。 直 至 确定 新 版 本 没有 
问题 后 ， 再 将 旧版 本 所 运行 的 环境 作为 下 一 个 新 版 本 的 预 生产 环境 ， 部 署 未 来 的 新 版 本 ， 
如 图 12-6 所 示 ,“ 蓝 ”和 “ 绿 ” 仅 代表 两 个 相互 独立 的 部 署 环 境 。 

Vl 


Web 服 务 应 用 服务 
V1 V1 
信人 0 
Web 服 务 应 用 服务 数据 库 服务 
V2 V2 V2 


图 12-6” 蓝 绿 部 署 
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当然 ， 这 是 一 个 非常 理想 的 情况 。 现 实 中 ， 数 据 库 复 制 的 时 间 成 本 较 高 ， 而 且 空间 成 
本 也 较 高 。 因 此 ， 很 多 蓝 绿 部 署 方案 会 使 用 相同 的 数据 库 服 务 ， 只 是 软件 的 部 署 使 用 不 同 
的 两 套 环境 ， 如 图 12-7 所 示 。 在 这 种 情况 下 ， 同 一 个 数据 存储 格式 必须 对 新 旧 两 个 软件 版 
本 做 兼容 性 处 理 ， 使 其 可 以 同时 服务 于 两 个 软件 版 本 对 数据 的 操作 。 
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图 12-7 使 用 相同 数据 存储 节点 的 蓝 绿 部 团 

















另外 ， 蓝 绿 部 署 中 还 有 一 个 需要 处 理 的 问题 。 也 就 是 ， 当 切换 发 生 在 用 户 的 一 次 业务 
操作 过 程 当中 且 涉 及 事务 处 理 时 ， 如 何 处 理 数据 的 一 致 性 问题 。 一 般 来 说 ， 切 换 并 不 是 在 
瞬间 完成 的 。 在 切换 的 过 程 当中 ， 新 的 请 求 直接 被 导向 到 新 版 本 的 环境 ， 不 再 允许 访问 旧 
版 本 的 环境 。 对 于 那些 在 切换 发 生 时 尚未 返回 结果 的 他 有 请 求 ， 旧 版 本 的 环境 允许 其 访问 
完成 ， 之 后 不 再 接收 新 的 请 求 即 可 。 
12.2.2 “滚动 部 署 

滚动 部 署 (rolling deployment) 是 指 从 服务 集群 中 选择 一 个 或 多 个 服务 单元 ， 停 止 服 
务 后 执行 版 本 更 新 ， 再 重新 将 其 投入 使 用 。 循 环 往复 ,直至 集群 中 所 有 的 服务 实例 都 更 新 
到 新 版 本 ， 如 图 12-8 所 示 。 与 蓝 绿 部 署 相 比 ， 这 种 方式 更 加 节省 资源 。 因 为 它 不 需要 准备 
两 套 一 模 一 样 的 服务 运行 环境 。 因 此 ， 服 务 器 的 成 本 就 相当 于 少 了 一 半 。 
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加 vi "vw 
V2 V2 V2 
升级 前 升级 中 (1/3) 升级 中 (2/3) 升级 完成 (3/3) 





图 12-8 “滚动 部 团 
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当 新 版 本 出 现 问题 时 , 这 种 滚动 部 署 方式 无 法 像 蓝 绿 部 署 那 样 只 要 直接 通过 前 面 的 流 
量 负载 均衡 器 直接 切换 回 旧 环 境 即 可 ， 而 是 必须 要 对 其 中 已 部 署 新 版 本 的 服务 器 进行 回 
滚 。 另 一 种 方式 就 是 快速 修复 问题 ， 生 成 第 三 个 版 本 V3 ， 然 后 马上 发 起 一 次 V3 的 滚动 部 
署 。 此 时 ， 服 务 集群 中 就 可 能 会 有 V1、V2 和 V3 三 个 版 本 存在 。 


12.2.3” 金 丝 省 发 布 与 灰 度 发 布 


“ 金 丝 御 发 布 ”(canary release) 就 是 泛 指 通 过 让 一 小 部 分 用 户 先 行使 用 新 版 本 ， 以 便 
提前 发 现 软件 存在 的 问题 ， 从 而 避免 让 更 多 用 户 受 到 伤害 的 发 布 方式 。 因 为 仅 有 一 小 部 分 
用 户 使 用 ， 所 以 造成 的 影响 也 比较 小 。 

“ 金 丝 淮 发 布 ”的 名 字 来 自 矿工 下 井 的 一 个 古老 实践 。17 世 纪 ， 英 国 矿井 工人 发 现 ， 金 
丝竹 对 瓦斯 这 种 气体 十 分 敏感 。 当 时 ， 采 矿工 人 为 了 保障 自身 的 安全 ， 每 次 下 井 工 作 时 都 
带 上 一 只 金 丝 省 。 如 果 井 下 存在 有 害 气 体 ， 在 人 体 还 没有 察觉 到 有 害 气 体 时 ， 金 缘 省 就 会 
因 无 法 抵抗 瓦斯 气体 而 死亡 。 此 时 ， 矿 工 就 会 知道 井下 有 毒气 ， 马 上 停止 工作 ， 回 到 地 面 。 

“ 灰 度 发 布 ” 是 指 将 发 布 分 成 不 同 的 阶段 ， 每 个 阶段 的 用 户 数量 逐 级 增加 。 如 果 新 版 
本 在 当前 阶段 没有 发 现 问 题 ， 就 再 扩展 用 户 数 量 进入 下 一 个 阶段 ， 直 至 扩展 到 全 部 用 户 。 
它 是 金 丝 稚 发 布 的 一 种 延伸 ， 也 可 以 说 ， 金 丝 稚 发 布 是 灰 度 发 布 的 初始 级 别 ， 如 图 12-9 所 
示 。 对 于 “划分 多 少 个 阶段 ， 每 个 阶段 的 用 户 数量 是 多 少 ”， 要 根据 产品 状态 自行 定义 。 













































100% 


图 12-9 人 金 丝 和 省 发 布 与 灰 度 发 布 示意 图 








2012 年 Facebook 公 司 对 其 网 站 首页 做 过 一 次 大 改版 ,引入 了 用 户 首页 的 大 图 展示 , 并 
以 灰 度 方式 发 布 。 当 用 户 数量 为 总 用 户 数 的 1% 时 ,网 站 的 很 多 项 数据 (如 浏览 量 、 页 面 打 
开 率 等 ) 都 有 所 下 降 。 经 过 讨论 后 ， 团 队 认 为 是 这 些 用 户 对 新 版 本 暂时 性 不 适应 ， 决 定 继 
续 扩 大 用 户 数 。 当 用 户 超过 10% 以 后 ， 数 据 表明 ， 各 项 关键 业务 指标 仍旧 表现 不 佳 ， 因 此 
Facebook 公 司 最 终 放 弃 了 这 次 首页 大 改版 ,恢复 了 原 有 的 版 本 。 

有 两 种 实现 方式 可 以 达到 金 丝 害 ( 灰 度 ) 发 布 的 效果 。 一 是 通过 开关 隔离 方式 实现 ( 开 
关 技 术 的 具体 方式 参见 12.3.1 节 )， 它 是 指 : 将 软件 的 新 版 本 部 署 到 生产 环境 中 的 所 有 市 点 ， 
通过 配置 开关 的 方式 ， 针 对 不 同 范围 的 用 户 开 放 新 功能 。 例 如 网 络 接 入 层 、Web 层 、 业 务 
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逻辑 层 都 可 以 用 于 设计 灰 度 方案 , 但 具体 使 用 哪 种 方案 , 需要 根据 具体 业务 场景 确定 。 例 
如 ， 利 用 网 关 做 灰 度 控制 ， 有 基于 了 P 或 cookie 的 ， 有 基于 某 个 请 求 参 数 做 流量 切换 实现 白 
名 单 的 (uuid 或 者 手机 号 )， 也 有 基于 地 域 或 者 流量 百分比 来 切换 的 等 。 

二 是 通过 前 面 讲 过 的 滚动 部 署 方式 实现 , 它 是 指 : 将 软件 的 新 版 本 部 署 到 生产 环境 中 
的 一 部 分 节点 上 ， 那 么 原 有 对 这 些 节 点 的 访问 流量 就 会 使 用 这 个 新 版 本 的 功能 ， 而 其 他 节 
点 上 的 访问 流量 仍旧 使 用 原版 本 的 功能 。 当 确认 没有 风险 后 ,再 用 新 版 本 逐步 替换 其 他 市 
点 的 旧版 本 ， 直 至 全 部 替换 完成 。 两 种 方式 如 图 12-10 所 示 。 
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软件 版 本 相同 3 各 部 村 节 上 的 
开关 配置 不 同 软件 版 本 不 同 


图 12-10 通过 开关 分 流 与 通过 物理 版 本 部 署 分 流 








12.2.4 “暗部 署 


暗部 署 (dark launch) 是 指 功能 或 特性 在 正式 发 布 之 前 ， 将 其 第 一 个 版 本 部 署 到 生产 
环境 ， 以 便 在 向 最 终 用 户 提 供 该 功能 之 前 ， 团 队 可 以 对 其 进行 测试 ， 并 发 现 可 能 的 错误 。 
“上 暗部 署 ” 中 的 “ 瞳 ” 字 ， 是 针对 “用 户 无 感知 ”这 一 点 而 言 ， 这 可 以 通过 开关 技术 来 实 
现 。 例 如 下 面 这 个 场景 : 某 个 互联 网 公司 重新 开发 了 一 个 在 线 新 闻 推荐 算法 ,希望 能 够 为 
用 户 推荐 更 多 的 优秀 内 容 。 但 是 ， 由 于 算法 复杂 ， 公 司 想 知道 在 大 量 的 真实 用 户 访 问 情况 
下 ， 这 个 算法 的 性 能 到 底 如 何 。 这 时 要 如 何 做 呢 ? 

我 们 可 以 为 这 个 算法 配置 一 个 开关 ， 并 将 其 部 署 到 生产 环境 中 。 当 这 个 开关 打开 时 ， 
就 会 有 流量 进入 这 个 算法 。 但 是 用 户 并 不 知道 他 用 的 是 旧 算 法 ， 还 是 新 算法 。 如 果 这 个 算 
法 的 性 能 不 够 好 , 我 们 可 以 马上 关闭 这 个 开关 , 让 用 户 使 用 原来 的 旧 算 法 , 图 12-11 给 出 的 
是 其 操作 步骤 。 

我 们 还 可 以 使 用 第 10 章 介绍 过 的 流量 克隆 方式 来 进行 。 即 对 每 个 请 求 都 克隆 一 份 ， 
发 送 给 这 个 新 算法 。 但 这 个 新 算法 并 不 向 用 户 反 馈 结果 ， 而 是 由 开发 人 员 自 己 收 集 数 据 ， 
图 12-12 为 其 工作 流程 。 
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(a) 初始 状态 Cb) 开关 + 部 团 C6) 切换 新 算法 Cd) 拓 败 ， 切 换 旧 算 法 


图 12-11 开关 方式 的 暗部 署 








(a) 初始 状态 《b) 克隆 流量 + 部 署 (c) 流量 输入 新 算法 (d) 失败 ， 关 闭 引 流 
图 12-12 ”流量 克隆 方式 的 暗部 署 
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我 们 在 第 8 章 中 提 到 ， 发 布 频率 与 分 支 策 略 有 一 定 的 对 应 关系 。 当 一 个 软件 团队 的 发 
布 频率 高 于 一 周一 次 时 ， 采 用 “主干 开发 ， 主 干 发布 ” 才 是 更 为 经 济 的 做 法 。 然 而 ， 这 样 
做 也 会 遇 到 一 个 现实 问题 : 假如 某 个 功能 比较 复杂 ， 无 法 在 两 次 发 布 之 间 完 成 开发 ， 那 么 
我 们 用 什么 办 法 来 处 理 这 个 问题 呢 ? 解决 问题 的 办 法 有 3 个 。 

(1) 拆 分 功能 。 将 一 个 功能 进行 分 解 ， 分 解 为 更 小 的 在 一 个 开发 周期 内 能 够 完成 的 
功能 集 。 我 们 在 第 6 章 中 也 有 过 介绍 ， 即 将 一 个 功能 分 成 欠 代 周期 内 可 交付 的 子 功能 ， 如 
图 12-13 所 示 。 当 然 ， 如 果 不 是 新 功能 开发 ， 而 只 是 技术 性 改造 ， 也 可 以 使 用 后 面 介绍 的 
抽象 分 支 技术 来 实现 。 

(2) 先后 再 前 。 先 实现 服务 端 功 能 ， 再 实现 用 户 界面 。 即 首先 实现 用 户 不 可 见 的 那 部 
分 功能 ， 同 时 要 确保 不 影响 原 有 的 功能 。 这 样 ， 即 便 这 一 功能 代码 被 带 到 生产 环境 中 ， 因 
为 没有 操作 入 口 ， 也 不 会 对 发 布 有 影响 ， 同 时 还 可 以 使 用 暗部 署 + 流 量 克 隆 方式 来 验证 新 
功能 在 后 台 服 务 端 实现 方面 的 质量 ， 如 图 12-14 所 示 。 
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基本 功能 功能 增强 (1) 功能 增强 2 
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12-13 ”大 功能 的 拆 分 实现 


发 布 发 布 2 发 布 3 
隐藏 界面 后 端 业务 前 兹 页 面 
与 框架 。 特性 逻辑 ji 展现 。 光 玫 

不 可 用 不 可 用 特性 


图 12-14 ”先后 端 再 前 端 
(3) 功能 开关 技术 。 通 过 开关 来 隐藏 未 开发 完成 的 功能 > 这 是 我 们 接 下 来 介绍 的 重点 。 
12.3.1 功能 开关 技术 


什么 是 “功能 开关 (Feature Flag 或 Feature Toggle)”? 从 代码 的 角度 来 讲 ， 每 个 开关 
的 本 质 就 是 一 个 “if……else……” 条 件 语句 块 。 让 我 们 以 某 电 商 网 站 为 例 ， 说 明 一 下 。 该 
网 站 使 用 PHP 编 程 语言 实现 其 网 站 功能 。switch.config 的 文件 片断 如 下 : 





























01. S$cfg['new_ search'] = array('enabled' => 'off'); 

02. S$cfg['sign in'] = array('enabled' => 'on'); 

03. S$cfg['checkout'] = array('enabled' => 'on'); 

04. scfg['homepage'] = array('enabled' => 'on'); 

当 需 要 设计 一 个 新 的 商品 搜索 算法 时 ， 在 配置 文件 switch.config 中 加 入 上 面 的 第 一 行 
代码 。 


同时 ,在 使 用 商品 搜索 算法 的 相关 代码 位 置 上 , 添加 条 件 判 断 语句 。 当 新 的 搜索 算法 
开关 new_search 为 on 上 时， 就 执行 4o_solr () ， 否 则 就 执行 4o_grep () ， 如 下 所 示 : 





01. if($cfg['new search'] == 'on') { 

02 . $results = do_solr(); // 调用 新 的 商品 搜索 算法 
03. } else { 

04. $results = do_grep(); // 调用 旧 的 商品 搜索 算法 
05. } 


我 们 可 以 看 到 ， 当 代码 执行 到 这 里 时 ， 它 会 从 配置 文件 switch.config 中 读 取 配置 
pew_ seareh， 天 近 我 们 该 计 的 更 反 不 同 的 了 人行 。 当 和 外 不 同 的 用 户 了 用 
新 的 搜索 功能 时 ， 通 常 可 以 对 配置 项 mew_search' 进 行 修改 来 达到 目标 ， 如 下 所 示 ; 
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01 $cfg['new_search'] = array('enabled' => 'on'); // 所 有 用 户 可 用 
02. Scfg['new search'] = array('enabled' => 'staff'); // 内 部 员工 可 用 
03 Scfg['new_ search'] = array('enabled' => '1%'); // 1% 的 用 户 可 用 
04. S$cfg['new_ search'] = array('enabled' => 'users', PSE TiSt = 


‘qiao_liang'); 

05. // 针 对 具体 用 户 白 名 单 可 用 

开关 技术 本 身 并 不 是 一 种 新 技术 。 例 如 ， 对 很 多 商业 套装 软件 来 说 , 通常 软件 授权 证 
书 (license) 就 是 一 个 开发 ， 用 于 激活 你 购买 的 软件 。 而 且 不 同 的 授权 证 书 ， 还 可 以 激活 
该 软件 中 的 不 同 功能 。 

对 于 这 类 商业 套装 软件 , 我 们 原来 倾向 于 在 对 外 正式 发 布 的 软件 包 中 仅 包 括 完 整 功能 
代码 ， 那些 未 实现 的 功能 代码 被 禁止 带 入 正式 发 布 包 中 。 这 种 软件 授权 通常 用 于 针对 不 同 
用 户 的 功能 可 见 性 策略 ,从 而 完成 不 同 的 收费 模式 。 而 且 , 这 种 开发 模式 目前 仍 在 使 用 中 。 

现在 ， 对 高 频率 的 软件 部 署 来 说 ， 开 关 技 术 被 赋予 了 两 种 新 的 用 途 。 

(1) 隔离 : 即将 未 完成 功能 的 代码 隔离 在 执行 路 径 之 外 ， 使 之 对 用 户 不 产生 影响 ， 

(2) 快速 止血 : 一 旦 生产 环境 出 了 问题 ， 直 接 找到 对 应 功能 的 开关 选项 ， 将 其 设置 为 
“关闭 ”。 

开关 技术 是 达成 高 频 部 署 的 一 种 合理 技术 手段 ， 尤 其 是 像 Etsy 公 司 使 用 “主干 开发 ， 
主干 发 布 ” 的 策略 ， 所 有 开发 者 直接 向 主干 提交 代码 ， 这 一 手段 就 更 为 必要 。 

当然 ， 使 用 开关 技术 也 会 带 来 成 本 。 首 先 ， 每 个 开关 选项 最 少 有 两 个 状态 ,“ 开 ”和 
“ 关 ”。 当 我 们 在 发 布 之 前 对 软件 进行 功能 验证 时 ， 需 要 考虑 每 个 开关 在 系统 中 的 状态 ， 有 
时 甚至 要 进行 组 合 测试 。 开 关 的 数量 越 多 ， 可 能 就 会 产生 越 多 组 合 测试 的 成 本 。 其 次 ， 并 
不 是 所 有 的 开关 代码 都 能 以 优雅 的 方式 实现 ， 给 代码 的 编写 和 维护 都 带 来 一 定 的 复杂 性 ， 
需要 细心 设计 。 最 后 ， 开 关 在 系统 中 存在 的 时 间 越 长 ， 维 护 它 的 成 本 就 越 高 。 

为 了 能 够 最 大 化 利用 开关 带 来 的 好 处 ,并 尽 可 能 减少 它 带 来 的 成 本 ,应 该 对 开关 进行 
系统 化 的 管理 ， 并 尽 可 能 遵循 以 下 原则 。 

(1) 在 满足 业务 需求 的 前 提 下 , 尽 可 能 少 用 开关 技术 。 由 于 开关 本 质 上 是 if……else…… 
的 语句 ， 它 会 带 来 程序 的 复杂 性 ， 尤 其 是 代码 设计 混乱 、 代 码 模块 职责 不 清晰 时 ， 更 容易 
出 错 。 

(2) 如 果 在 “分 支 ” 和 “开关 ”之 间 选 择 ， 尽 可 能 选择 开关 技术 。 首 先 ， 使 用 开关 方 
式 ， 可 以 小 步 迭 代 ， 其 次 ， 可 以 在 主干 上 与 他 人 代码 频繁 集成 ， 尽早 发 现 设 计 冲 突 问题 ， 
最 后 ， 创 建 分 支 会 带 来 后 期 的 分 支 合 入 以 及 多 次 测试 成 本 。 

(3) 软件 团队 应 对 开关 配置 项 进行 统一 管理 ， 方 便 查 找 和 查看 状态 。 

(4) 尽 可 能 使 用 统一 的 开关 框架 和 开关 策略 。 开 关 策 略 是 指 开 关 的 定义 、 命 名 ,以 及 
如 何 配 置 。 
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(5) 定期 检查 和 清理 不 必要 的 开关 项 。 

下 面 是 几 个 常见 的 开关 工具 。gflag 是 由 谷歌 公司 贡献 的 C/C++ 的 开源 工具 ，Java 社 区 
可 以 使 用 Togglz ， 或 者 Flip。Grails 可 以 使 用 grails-feature-toggle ，.Net 社 区 可 以 参见 
FeatureToggle, 


12.3.2 ”数据 迁移 技术 


任何 软件 服务 都 会 处 理 数 据 ， 而 且 会 对 其 中 的 很 多 数据 进行 持久 化 。 随 着 软件 服务 时 
间 的 增长 ， 数 据 会 越 来 越 多 。 因 此 ， 对 数据 库 结构 的 修改 相对 比较 复杂 ， 更 新 耗 时 较 多 。 

对 那些 发 布 频率 较 低 的 企业 级 应 用 来 说 , 当 有 新 版 本 的 软件 发 布 时 , 通常 要 提前 停机 ， 
然后 通过 SQL 命令 直接 修改 字段 结构 ， 整 理 字段 中 的 所 有 数据 。 待 全 部 完成 后 ， 再 部 署 新 
的 软件 版 本 ， 最 后 启动 程序 ， 恢 复 服 务 。 











只 增 不 删 
对 每 天 都 需要 处 理 海 量 数据 的 互联 网 应 用 来 说 ,在 高 频 发 布 模式 下 ， 向 全 二 
的 变更 不 会 像 应 用 程序 那样 可 以 每 天 数 次 , 但 是 每 周 有 一 次 数据 库 结构 变更 可 能 也 是 很 正 





ti ni ee 
数据 库 结 构 的 变更 ， 最 简单 的 方式 就 是 “字段 尽 可 能 只 增 不 删 "、 即 对 数据 库 表 中 的 原 有 
字段 不 再 进 和 

如 图 12-15 所 示 ， 原 始 数 据 库 结构 中 ， 配 送 地 址 信息 被 分 成 3 个 字段 ， 并 且 已 有 历史 数 
据 的 存储 (图 中 的 个 人 信息 并 非 真实 信息 ， 而 是 简单 的 虚构 示例 )。 由 于 这 3 个 字段 总 是 一 
起 使 用 , 因此 决定 合并 成 一 个 字段 。 那么 , 我 们 可 以 增加 一 个 新 的 字段 , 名 为 “配送 地 址 ”， 
并 对 应 用 程序 进行 两 部 分 修改 。 








001 张 世 月 ”北京 市 朝阳 区 柳 芳 南 里 29 号 

002 ”李建国 ”上 海 市 张江 高 科技 园区 ” 海 科 路 99 号 

003 ” 孙 晓 丹 ”北京 市 海淀 区 上 地 十 街 3 号 楼 

001 ” 张 声 月 ”北京 市 朝阳 区 柳 芳 南 里 29 号 

002 ”李建国 ”上海 市 张江 高 科技 园区 ” 海 科 路 99 号 

003 ”和 孙 晓 上 丹 ”北京 市 海淀 区 上 地 十 街 3 号 楼 

004 “” 王 永明 ”北京 市 东城 区 和 平 里 十 三 区 5 号 楼 ' 北京 市 东城 区 和 平 里 十 三 区 5 号 楼 
005 ” 泰 剑 飞 ”北京 市 东城 区 和 平 里 八 区 12 号 楼 北京 市 东城 区 和 平 里 八 区 12 号 楼 











图 12-15 ”字段 只 增 不 减 
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(1) 由 于 无 法 确定 是 否 还 有 其 他 程序 使 用 原 有 的 3 个 字段 ， 因 此 写 入 信息 时 ， 同 时 向 
所 有 字段 保存 对 应 的 信息 。 

(2) 当 需 要 读 取 这 个 信息 时 ， 可 以 先 从 配送 地 址 这 个 字段 读 取 信息 ， 如 果 返 回 为 空 ， 
说 明 这 是 旧 记 录 ， 需 要 从 原来 的 3 个 字段 分 别 读 取 信息 ， 并 自行 拼接 在 一 起 。 

这 类 修改 对 应 用 程序 的 改动 相对 较 小 ， 并 且 不 需要 在 数据 库 中 处 理 原 有 的 数据 。 

2. 数据 迁移 

在 大 多 数 情况 下 ， 上 面 的 方法 可 以 应 对 。 但 是 在 某 些 时 候 却 无 法 使 用 ,例如 将 数据 存 
储 系统 从 H2DB 转 换 成 MySQL， 或 者 将 原 有 系统 拆 分 成 多 个 系统 ， 又 或 者 单 表 数 据 量 过 大 
等 情况 。 这 时 需要 做 大 量 数据 的 搬迁 工作 。 

此 时 做 数据 迁移 工作 ， 通 常 按照 以 下 5 个 步骤 。 

(1) 为 数据 库 结 构 增 加 一 个 新 版 本 。 

(2) 修改 应 用 程序 ， 同 时 向 两 个 版 本 的 结构 中 写 入 数据 。 
(3) 编写 脚本 程序 ， 以 后 台 服务 的 方式 将 原来 的 历史 数据 回填 到 新 版 本 的 结构 中 。 
(4) 
( 














4) 修改 应 用 程序 ， 从 新 旧 两 个 版 本 中 读 取 数据 ， 并 进行 比较 ， 确 保 一 致 。 
5) 当 确 认 无 误 后 ,修改 应 用 程序 ， 只 向 新 版 本 结构 写 入 数据 。 可 以 将 原来 的 旧版 本 
数据 保留 一 段 时 间 ， 以 防止 未 预料 的 问题 出 现 。 





数据 库 中 两 表 合 并 的 过 程 

在 茶 互 联网 公司 就 遇 到 过 类 似 情 况 。 由 于 刚 开始 的 时 候 团队 经 验 较 少 , 因此 在 设计 
数据 结构 时 ， 为 了 存储 注册 用 户 的 信息 ,设计 了 两 张 数据 库 表 ,一 张 名 为 Users， 保存 
了 用 户 的 基础 信息 ， 另 一 张 名 为 User profiles, 保存 了 用 户 的 扩展 信息 。 其 目的 是 
为 了 后 续 业 务 扩展 时 ， 可 以 不 必修 改 Users 表 ， 而 只 根据 不 同 的 业务 ， 增 加 
User profiles 中 信息 即 可 。 

然而 ， 系 统 运行 一 段 时 间 后 ， 团 队 发 现 User profiles 的 使 用 次 数 并 不 多 ,但 是 
每 次 用 户 服 务 读 取信 息 时 , 都 要 分 别 从 两 个 数据 库 表 中 获取 数据 , 速度 也 比较 慢 . 因此 ， 
团队 打算 将 User profiles 表 中 的 数据 合并 到 Users 表 中 ， 并 将 User Profiles 删 
除 。 那 么 如 何 设计 这 次 变更 流程 呢 ? 

第 一 步 : 修改 数据 库 结构 。 

(1) 写 一 个 SQL 脚本 ， 将 User profiles 表 中 各 列 结构 加 入 Users 表 中 。 

(2 ) 修改 应 用 程序 ， 加 入 3 个 新 配置 开关 项 ， 如 下 所 示 : 








(Gules 'write profile to user profiles_ table'=>'on' 
几 吕 机 'write profile to user_ table'=>'off' 
A 'read profile from users_ table'=>'off' 





修改 完成 后 ， 发 布 这 次 版 本 修改 。 
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第 二 步 : 修改 应 用 程序 ， 同 时 向 两 个 版 本 的 结构 中 写 入 数据 。 
(1) 修改 代码 ， 将 profile 写 入 原来 的 User profiles 表 中 ， 也 同时 写 入 Users 表 。 
(2 ) 修改 第 2 行 的 配置 开关 ， 改 为 'on'， 如 下 所 示 : 








Oa 'write profile to user profiles_ table'=>'on' 
四 到 二 'write profile to user_ table'=>'on' 
0 'read profile from users_ table'=>'off' 





修改 完成 后 ， 发 布 这 次 版 本 修改 。 

第 三 步 : 编写 一 个 可 离线 执行 的 后 台 脚 本 ,批量 将 原来 的 历史 数据 回填 到 新 版 本 的 
结构 中 。 

这 一 步 不 需要 修改 生产 环境 中 的 代码 ， 而 是 写 一 个 离线 程序 ， 将 原来 存 于 
User profiles 表 中 的 数据 写 到 Users 表 中 的 对 应 的 数据 列 中 。 运行 该 离线 程序 ， 直 
到 全 部 数据 同步 完成 。 

第 四 步 : 从 新 旧 两 个 版 本 中 读 取 数据 ， 并 进行 比较 ， 确 保 一 致 。 

(1) 修改 应 用 程序 ， 在 需要 读 取 数 据 的 时 候 ， 从 两 个 表 中 分 别 读 取 对 应 的 数据 ， 并 
在 内 存 中 进行 对 比 ， 验 证 数据 是 否 一 致 。 如 果 数 据 不 一 致 ， 可 以 写 入 上 日志， 然后 离线 处 
理 。 也 可 以 根据 事先 预定 义 的 修订 策略 ， 对 数据 进行 修复 ， 

(2 ) 修改 第 3 行 的 配置 开关 ， 让 内 部 员工 可 以 征用 68ers 表 的 信息 ， 修 改 开 关 
read profile from users table 为 !'staff' 元 妇 下 所 示 : 








Ol 'write profile to user profiles table'=>"6n' 
(02 'write profile to user_ table'=>'on' 
3 'read profile from users table'=>'staff' 





修改 完成 后 ， 发 布 这 次 版 本 修改 。 此 时 ,相当 于 发 布 了 员工 内 部 体验 版 本 。 由 员工 
来 验证 数据 的 一 致 性 ， 直 至 确认 无 误 。 

第 五 步 : 当 确认 无 误 后 ， 修 改 应 用 程序 ， 只 向 新 版 本 结构 写 入 数据 。 

修改 第 3 行 的 配置 开关 ， 让 5% 的 用 户 可 以 使 用 Users 表 的 信息 ， 修 改 开 关 
read profile from users table 为 '5%'， 如 下 所 示 : 








(Os 'write profile to user profiles table'=>'on' 
02. viteaorotilento Ser table, = On 
上 二 'read profile from users_ table'=>'5%' 





修改 完成 后 ， 发 布 这 次 版 本 修改 。 确 认 运 行 无 误 ， 重 复 这 一 步骤 ， 让 更 多 的 用 户 使 
用 Users 表 中 的 信息 ， 直 至 100%， 即 最 后 一 个 配置 项 从 '5%' 变 为 'on'。 

第 六 步 : 放弃 旧版 本 《这 是 一 个 可 选 步骤 )。 

持续 运行 足够 长 的 时 间 ， 且 没有 发 现 问题 时 ， 修 改 开关 write profile to _ user _ 
profiles table 为 'off'， 不 再 向 User Profiles 表 中 写 入 数据 ， 如 下 所 示 : 
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(0 'write profile to user profiles table'=>'off' 
0 六 'write profile to user_ table'=>'on' 
2 'read profile from users_ table'=>'on' 





修改 完成 后 ， 发 布 这 次 配置 变更 。 


12.3.3 ”抽象 分 支 方 法 

当 我 们 进行 大 的 架构 改动 时 ， 通 常会 需要 较 长 的 时 间 。 传 统 的 做 法 如 图 12-16 所 示 : 
在 当前 的 产品 代码 分 支 上 创建 一 个 新 的 分 支 ， 用 于 大 规模 重 写 ， 然 后 再 将 新 增 功能 移植 到 
这 个 分 支 上 。 大 规模 重 写 的 这 个 分 支 在 很 长 一 段 时 间 内 无 法 发 布 ， 直到 最 后 全 部 修改 完成 
后 。 这 种 方式 无 法 做 到 持续 发 布 ， 业 务 需 求 的 实现 会 有 阶段 性 停 诺 ， 架 构 调整 后 第 一 次 发 
布 时 出 现 问题 的 概率 较 大 ， 需 要 一 定 的 质量 打磨 周期 。 

















大 规模 架构 改造 ， 无 法 发 布 















旧 分 支 的 
新 增 功能 同步 





() @ () 
原 有 产品 分 支 只 修改 严重 缺陷 
图 12-16 ”通过 真实 分 支 重 构 发 布 
“抽象 分 支 方法 ”是 在 不 创建 真实 分 支 的 情况 下 ， 通 过 设计 手段 ， 将 大 的 重 构 项 目 分 
解 成 很 多 个 小 的 代码 变更 步 又 ,逐步 完成 重大 的 代码 架构 调整 。 例 如 希望 将 软件 中 的 一 部 
分 代码 使 用 另外 一 种 方式 实现 ， 使 用 “抽象 分 支 方法 ”的 过 程 如 图 12-17 所 示 。 






































Ca) 找到 边界 (b) 插入 中 间 层 (c) 逐步 替代 旧 代码 Cd) 移 除 旧 代码 
图 12-17 ”抽象 分 支 方法 进行 技术 改造 
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图 12-17a 所 示 的 情况 应 该 在 软件 代码 中 找到 将 要 替换 的 那 部 分 代码 ， 图 12-17b 所 示 的 
情况 应 在 这 块 代码 与 其 他 代码 之 间 插 入 一 段 隔离 代码 ， 它 们 都 通过 隔离 代码 进行 交互 ; 图 
12-17c 所 示 的 情况 应 实现 新 的 代码 ， 逐 步 奉 代 旧 代码 ;图 12-17d 所 示 的 情况 应 直至 替代 原 
定 的 旧 代 码 实现 。 

通过 这 种 方式 ,我 们 可 以 做 到 ; 在 不 创建 代码 分 支 的 情况 下 ， 达 到 “创建 分 支 进行 重 
构 ” 的 同样 结果 。 其 好 处 在 于 : 

。 重 构 的 同时 也 能 交付 业务 功能 需求 ; 

e 可 以 逐步 验证 架构 调整 的 方向 和 正确 性 ，; 

e 如 果 过 到 紧急 的 情况 ， 很 容易 暂停 ， 而 且 不 浪费 之 前 的 工作 量 ，; 

。 能 够 强化 团队 的 合作 性 ， 

e 可 以 使 软件 架构 更 模块 化 ， 变 得 更 容易 维护 。 

使 用 “抽象 分 支 方法 ”也 有 成 本 ， 例 如 ， 整 个 修改 的 时 间 周 期 可 能 会 拉 长 ， 由 于 是 达 
代 完 成 ， 总 体 工 作 量 比 一 次 性 完成 的 情况 要 大 。 

框架 iBatis 和 Hibernate 是 两 种 对 象 关系 映射 框架 (Object Relational Mapping，ORM )。 
GoCD 团 队 曾 使 用 抽象 分 支 方法 成 功 将 iBatis 禁 换 成 Hibernate， 并 且 有 两 个 对 外 发 布 的 版 本 
同时 包含 了 这 两 个 ORM 框 架 。 在 使 用 这 种 抽象 分 支 方 法 之 前 ? 团队 也 曾 尝 试 使 用 从 主干 上 
创建 分 支 进行 框 架 替 换 ， 但 是 失败 了 。 也 就 是 说 ， 团 卫 大 多 数 人 在 主干 上 开发 功能 ,分支 
上 做 框架 替换 ， 每 天 将 主干 代码 同步 到 分 支 上 。 原 来 以 为 3 周 可 以 完成 的 任务 ，6 周 也 没有 
能 够 完成 。 这 也 说 明 ， 当 进行 大 的 改造 时 ， 如 果 使 用 创建 分 支 的 方式 ， 通 常 必 须 停 止 大 部 
分 的 新 功能 开发 ， 否 则 很 难 成 功 。 
12.3.4 ”升级 替代 回 深 

俗语 说 ,“ 常 在 河 边 走 ， 哪 能 不 湿 鞋 ”"。 我 们 总 会 遇 到 部 署 或 发 布 后 出 现 一 些 问题 , 需 
要 马上 修复 。 如 果 你 已 经 使 用 我 们 前 面 介绍 的 开关 技术 ， 那 么 这 并 不 是 什么 困难 的 问题 ， 
你 只 需要 将 出 现 问题 的 新 功能 开关 重新 配置 一 下 ， 让 功能 不 可 见 即 可 。 但 是 ， 如 果 这 个 功 
能 没有 使 用 开关 技术 ， 怎 么 办 呢 ? 

根据 Dror G. Feitelson，Kent L. Beck 等 在 “Development and Deployment at Facebook” 
一 文中 提 到 ，Facebook 的 处 理 的 方法 是 : 尽 可 能 以 代码 升级 方式 代替 二 进 制 回 深 。 也 就 是 
说 , 典型 的 回 深 操 作 通 常 是 将 与 待 修复 的 问题 相关 的 某 次 提交 以 及 与 之 相关 的 任何 提交 一 
同 从 代码 仓库 中 直接 剔除 ， 然 后 再 次 提交 ， 等 待 下 一 次 发 布 即 可 。 这 样 ， 工 程 师 有 充分 的 
时 间 来 研究 和 真正 修复 这 个 问题 。 之 所 以 能 够 这 么 做 ， 得 益 于 Facebook 工 程 师 的 代码 提交 
遵循 “小 步 、 独 立 、 频 繁 ” 的 原则 ， 并 且 发 布 频率 比较 高 。Facebook 工 程 师 平 均 每 天 提交 
代码 0.75 次 ， 平 均 每 人 每 天 提交 约 100 行 代码 的 修改 ， 如 图 12-18 所 示 。 
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pe we a a 
(a) 平均 每 人 每 天 提交 代码 0.75 次 (b) 平均 每 人 每 天 提交 100 行 代码 
图 12-18 ”代码 Facebook 工 程 师 的 代码 提交 习惯 
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尽管 本 章 一 直 在 讨论 高 频 发 布 的 收益 与 做 法 , 但 并 不 是 说 ， | 
软件 。 例 如 ， 对 需要 跟随 硬件 发 布 的 认 入 式 软件 开发 来 说 ， 其 对 外 发 布 的 成 本 非常 
且 因 软件 出 现 问 题 而 导致 退货 率 上 升 ， 那 么 其 损失 可 能 相当 高 。 当 才 和 三 员 证 坎 秆 风 克 布 
频率 时 ， 需 要 综合 考虑 以 下 影响 因素 。 
(1) 增 量 发 布 带 来 的 收益 和 可 能 性 。 
每 次 发 布 或 部 署 的 操作 执行 成 本 有 多 高 。 
出 现 问题 的 概率 与 由 这 些 问题 带 来 的 成 本 有 多 少 。 
维护 同一 软件 的 众多 不 同 版 本 带 来 的 成 本 。 
高 频 发 布 模式 对 工程 师 的 技能 要 求 。 
支撑 这 种 高 频 发 布 所 需要 的 基础 工具 设施 与 流程 完善 性 。 
组 织 
这 些 景 





( 
(3 
( 
(5 
( 
' 对 这 种 高 频 发 布 的 态度 与 文化 取向 。 
多 响 因 素 中 ，5、6 和 7 对 前 面 4 项 的 结果 也 会 产生 直接 影响 。 很 可 能 由 于 这 3 项 
ee i 业 领 导 者 做 出 更 
多 的 努力 ， 在 后 面 3 项 上 投入 更 多 的 精力 。 

因为 部 署 发 布 有 风险 ， 所 以 大 家 均 习 惯 于 推迟 风险 ， 而 两 次 发 布 之 间 的 间隔 越 长 ， 累 
积 的 代码 变更 越 多 ,所 需 质量 验证 时 间 就 越 长 。 这 就 形成 了 一 个 渐进 增强 循环 ， 如 图 12-19 
所 示 。 当 我 们 采用 本 章 介 绍 的 方法 以 后 ， 可 以 降低 部 署 发 布 的 风险 ， 在 提高 发 布 频率 的 同 
时 ， 也 会 鼓舞 团队 士气 。 因 为 每 个 人 都 想 尽早 看 到 自己 的 劳动 成 果 被 真正 的 用 户 使 用 。 
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部 署 发 布 间隔 SR Ss 部 署 成 本 高 





推迟 发 布 到 
图 12-19” 推 壕 发 布 动机 的 渐进 增强 环 
































12.5 小结 


本 章 我 们 讨论 了 如 何在 快速 部 署 发 布 的 情况 下 , 通过 多 种 技术 手段 降低 风险 ,如 开关 
技术 、 数 据 库 迁 移 技 术 、 蓝 绿 部 署 、 金 丝 省 ( 灰 度 ) 发 布 、 抽 象 分 支 以 及 暗部 署 等 。 并 且 
强调 ， 即 便 没 有 使 用 开关 ,假如 团队 能 够 一 直 使 用 “小 步 完 整 的 代码 提交 ”策略 ， 也 可 以 
比较 容易 地 做 到 将 缺陷 快速 回 滚 。 

在 一 些 业务 场景 下 ,我 们 的 确 无 法 直接 高 频 地 对 外 发 布 软件 。 但是， 如 果 我 们 能 够 使 
用 本 章 介绍 的 方法 持续 向 预 生产 环境 进行 发 布 与 部 署 ,就 可 以 尽早 获得 软件 的 相关 质量 反 
馈 ， 从 而 减少 正式 发 布 后 的 风险 。 如 果 我 们 能 够 将 每 次 发 布 的 平均 成 本 降低 到 足够 低 ， 那 
么 将 会 直接 改变 团队 的 产品 研发 流程 。 
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RR 量 的 软件 ， 如 何 低 风险 地 部 署 和 发 布 软件 。 这 
只 是 持续 交付 验证 环 的 前 两 个 步 又， 第 一 步 将 我 们 选择 的 试验 方案 由 描述 性 语 
言 变 成 可 交付 的 软件 包 ， 第 二 步 将 软件 包 部 署 到 生产 环境 中 (或 交付 到 用 户 手 中 )， 让 它 
为 用 户 提供 软件 服务 。 我 们 尚未 形成 有 效 的 业务 闭环 。 当 我 们 对 软件 服务 进行 持续 监测 ， 
确保 我 们 交付 的 软件 可 以 为 客户 (用户 ) 持续 提供 服务 ,并且 能 够 收集 有 效 的 数字 反馈 信 
息 , 才能 够 完成 真正 的 持续 验证 闭环 (如 图 13-1 所 示 )，, 即 验 证 是 否 符合 我 们 在 探索 环 中 设 


定 的 业务 目标 预期 。 








~ CW 
|OOO| 人 
纪 纪 


13-1 快速 验证 环 的 闭环 














并 非 每 一 次 软件 变更 都 能 够 达到 预期 的 效果 。 一 些 软 件 变 更 在 部 署 之 后 , 会 出 现 服务 
性 能 下 降 的 情况 ， 进 而 影响 用 户 体验 ， 其 至 导致 服务 收入 下 降 。 国 际 大 型 互联 网 公司 均 出 
现 过 由 于 软件 变更 导致 Web 服 务 受 损 、 甚 至 中 断 的 事例 。 
。 案例 1: 2012 年 10 月 ，Google 的 一 次 负载 均衡 软件 升级 失败 ， 导 致 全 球 Gmail 业 务 
受 损 ， 且 持续 时 间 达 18 分 钟 。 
。 案例 2: 2014 年 12 月 ，Dropbox 对 服务 器 操作 系统 的 例 行 升级 中 存在 Bug， 导 致 
Dropbox 服 务 中 断 了 3 小 时 。 
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e 案例 3: 2014 年 6 月 ，Facebook 的 一 次 软件 系统 的 配置 变更 失误 ， 引 起 Facebook 服 务 
中 断 31 分 钟 。 
e 案例 4: 2014 年 11 月 ，Microsoft Azure 的 一 次 软件 升级 导致 Azure Storage 的 服务 受 损 。 
在 软件 变更 发 生 后 ， 快 速 、 准 确 地 评估 软件 变更 的 影响 ， 及 时 发 现 生 产 问 题 ， 并 快速 
定位 和 解决 它 一 直 是 软件 生命 周期 管理 中 ， 非 常 重要 的 一 项 任务 。 在 本 章 中 ,我 们 将 讨论 
快速 验证 环 的 最 后 两 个 环节 ， 即 “监测 ”与 “决策 ”。 


13.1 生产 监测 范 


根据 监测 内 容 的 不 同 ， 可 以 将 其 分 为 3 个 层次 ， 即 资源 监测 、 应 用 监测 和 业务 监测 。 
资源 监测 历来 是 系统 运 维 领域 的 重 中 之 重 , 其 基础 运 维 体系 建设 和 工具 支撑 也 相对 成 熟 完 
善 。 现 在 ， 应 用 软件 的 运行 监测 也 已 受到 产品 研发 部 门 的 重视 ,市 场 上 有 很 多 工具 开始 支 
持 相 关 数 据 的 收集 。 尤其 是 移动 互联 网 大 潮 来 临 后 , 设备 的 多 样 性 以 及 对 用 户 体验 的 关注 ， 
使 得 应 用 软件 的 运行 质量 监测 成 为 衡量 移动 互联 网 产品 研发 质量 指标 的 重要 数据 支撑 。 面 
向 大 众 的 互联 网 业务 或 产品 , 产品 预期 与 真实 用 户 反 馈 之 间 的 难 预测 性 使 得 越 来 越 多 的 企 
业 关 注 业 务 效 果 数 据 的 监测 

目前 软件 有 两 种 主要 的 服务 形式， 一 种 是 运行 王 我 们 自己 管理 的 后 台 服 务 器 上 ,持续 
为 用 户 提供 远程 服务 。 另 一 种 是 分 发 到 用 户 自己 手中 的 软件 包 如 移动 App、PC 端 软件 和 
硬件 设备 中 的 谍 入 式 软件 等 。 对 于 这 两 种 服务 ， 我 们 都 需要 进行 服务 监测 。 


13.1.1 后台 服务 的 监测 


后 台 服 务 监测 包括 3 个 层次 ,分别 是 基础 监测 、 应 用 监测 和 业务 监测 。 

(1) 基础 监测 是 对 系统 基础 设施 的 健康 度 进行 监测 ， 包 括 网 络 与 服务 器 节点 的 监测 ， 
监测 内 容 包括 网 络 连接 与 拥堵 状态 、CPU 负 载 和 内 存 及 外 部 存储 空间 的 使 用 状况 等 

(2) 应 用 监测 是 对 应 用 程序 的 运行 健康 度 进行 监测 ， 例 如 ， 应 用 程序 进程 是 否 存在 ， 
否 能 正常 提供 对 外 服务 ， 是 否 有 功能 缺陷 ， 是 否 能 正常 连接 数据 库 ， 是 否 有 超时 现象 ， 
否 有 服务 抛 出 的 异常 和 告警 ， 是 否 可 以 及 时 扩容 以 应 对 突 增 的 大 量 请 求 等 。 

(3) 业务 监测 是 对 业务 指标 健康 度 的 监测 。 例 如 ， 对 电 商 网 站 来 说 ， 应 当 包括 但 不 限 
于 实时 的 用 户 访 问 量 、 具 体 页 面 的 浏览 数 、 转 化 率 、 订 单 量 和 交易 额 等 。 


13.1.2 分 发 软件 的 监测 


由 于 分 发 软件 运行 的 环境 并 非 受 控 环境 , 对 它们 的 服务 监测 受到 客观 条 件 的 限制 。 通 
党 来 说 ， 我 们 需要 在 用 户 授权 的 条 件 下 ， 在 用 户 设备 上 收集 自身 软件 的 运行 状态 ， 以 及 宿 
主 设备 的 运行 状态 ， 并 将 收集 的 数据 定期 发 送 到 后 台 服 务 器 上 ， 由 后 台 服 务 对 收集 上 来 的 
数据 进行 分 析 与 呈现 。 如 果 宿 主 设备 运行 于 非 联 网 状态 ， 则 软件 需要 缓存 数据 到 本 地 ， 一 - 
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且 联 网 后 再 上 传 数据 。 

与 后 台 服 务 的 监测 一 样 , 分 发 软件 的 监测 也 包含 3 个 监测 层级 。 基 础 监测 是 软件 所 运行 
的 基础 环境 (如 移动 设备 的 机 型 、 操 作 系统 、 内 存 等 ) 的 运行 情况 ， 以 及 与 服务 器 的 连接 
情况 。 应 用 监测 是 软件 应 用 本 身 的 健康 状态 《如 内 存 使 用 、 程 序 崩溃 、 无 响应 、 与 后 台 服 








务 器 的 通信 情况 等 )。 业 务 监测 是 用 户 的 使 用 数据 ， 如 所 在 页 面 、 停 留 时 间 、 用 户 操作 等 。 














当然 ， 对 于 分 发 软件 的 监测 不 仅仅 是 来 自 软件 本 身 的 上 报 ， 企 业 还 要 关注 网 络 上 的 信 
息 ， 例 如 移动 软件 应 用 市 场 评 分 、 用 户 在 各 类 新 媒体 中 发 布 的 关于 软件 本 身 的 评价 等 ， 以 
便 从 更 广泛 的 渠道 全 面 收 集 信息 ， 及 时 修正 软件 中 的 缺陷 和 漏洞 ， 为 用 户 提供 最 优 体验 。 
13.2 ”数据 监测 体系 


为 了 得 到 有 效 的 监测 数据 ， 必 须 对 监测 数据 的 获取 过 程 、 处 理 流 程 进行 全 面 管理 ， 包 
括 数据 源 、 数 据 格 式 与 采集 周期 、 数 据 处 理 算法 等 。 


收集 与 处 理 
监测 数据 的 处 理 过 程 如 图 13-2 所 示 。 


13.2.1 














数据 存储 


s 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 了 








图 13-2 ”监测 数据 的 采集 和 处 理 、 户 











图 13-2 中 的 每 一 个 步骤 都 会 涉及 大 量 的 平台 处 理 与 运算 ， 其 相关 职责 如 下 。 


(1) 
2 
3 
4 
5 
(6) 


(2) 
(3) 
(4) 
(5) 


采集 上 报 : 
实时 分 析 : 
离线 分 析 : 
结果 输出 : 
问题 决策 : 





将 事先 定义 的 事件 数据 在 当地 采集 并 上 报 。 

对 各 数据 源 上 报 后 的 数据 进行 收集 、 清 洗 和 整理 。 
对 实时 数据 进行 分 析 处 理 。 
通过 大 量 数据 进行 模型 或 规则 提取 。 

将 实时 和 离线 分 析 的 结果 展现 ， 供 决策 参考 。 

根据 上 一 步 的 输出 ， 人 为 或 自动 给 出 下 一 步 的 行动 判定 ， 同时 将 判定 




















记录 保存 下 来 ， 以 便 为 后 续 决策 提供 依据 。 
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(7) 数据 存储 : 离线 的 原始 数据 、 分 析 数 据 以 及 处 理 记录 的 保存 。 
(8) 自动 修复 与 运 维 执行 体系 的 接口 ， 它 需要 将 修复 指令 发 送 给 运 维 执行 体系 ， 由 执 
行 体系 将 指令 分 发 到 对 应 节点 ， 并 进行 相应 的 操作 。 


13.2.2 ”数据 的 标准 化 


要 想得到 监测 数据 ， 我 们 必须 事先 对 软件 产生 的 事件 (Event) 进行 规划 和 跟踪 。 尤 
其 对 业务 数据 来 说 ， 更 需要 提前 规划 。 持 续 交 付 价值 环 中 一 再 强调 “探索 ”和 “验证 ”， 
其 最 重要 的 信息 来 源 之 一 就 是 真实 的 用 户 反 馈 。 为 了 提升 “验证 ”的 及 时 性 ， 我 们 在 实现 
业务 功能 之 前 ， 除 了 对 功能 实现 方案 的 讨论 ， 还 需要 做 好 另外 两 件 事 : 一 是 对 业务 指标 的 
定义 ， 也 就 是 说 ， 与 该 功能 相关 的 业务 指标 是 什么 ， 与 其 他 业务 指标 有 哪些 关联 性 ， 以 及 
如 何 计算 这 个 业务 指标 ， 二 是 数据 事件 的 定义 ， 为 了 得 到 这 个 业务 指标 的 数据 ， 应 该 在 产 
品 代码 的 哪个 位 置 埋设 监听 事件 , 输入 和 输出 格式 是 什么 样 的 ， 与 其 他 事件 之 间 的 关系 是 
什么 。 这 两 件 事情 是 确保 数据 准确 性 的 前 提 。 互 联网 创业 公司 在 快速 发 展期 经常 遇 到 的 
问题 就 是 数据 收集 问题 , 而 数据 收集 问题 的 根源 就 在 于 发 展 过 程 中 忽视 了 数据 指标 体系 建 
设 ,其 至 根本 没有 考虑 。 当 过 到 发 展 产 品 瓶颈 期 时 ,由 于 没有 相应 的 数据 体系 ， 无 法 深入 
洞察 用 户 行为 ， 而 显得 手忙脚乱 。 

通常 研发 团队 与 运 维 团队 对 基础 类 事件 〈 如 CPU 壹 内存: 硬盘 、 网 络 等 ) 和 应 用 事件 
(如 服务 响应 时 间 、 页 面 加 载 速度 、App 启 动 速度 等 ) 比较 关注 ,对 于 业务 事件 并 没有 太 多 
的 关注 。 缺 乏 经 验 的 产品 经 理 对 功能 实现 的 关注 度 远 远 高 于 对 数据 的 关注 度 。 

在 现实 工作 中 ， 你 是 否 会 经 常 遇 到 下 面 的 场景 ? 产品 经 理 打 算 对 已 有 功能 进行 改进 ， 
需要 收集 数据 做 一 些 背 景 支持 (或 者 需要 向 上 汇报 ) 时 ， 才 匆忙 向 数据 分 析 团 队 提 出 数据 
需求 。 然 而 ， 每 个 数据 请 求 可 能 都 需要 等 待 两 三 天 的 时 间 才 能 拿 到 ， 甚 至 更 久 。 拿 到 的 数 
据 经 常 不 准确 ， 数 据 前 后 矛盾 的 情况 也 时 常 发 生 。 这 通常 是 对 数据 监测 没有 重视 的 结果 。 

对 于 高 不 确定 的 业务 环境 ， 我 们 甚至 可 以 说 ， 业 务 数据 收集 的 重要 性 要 远 远 高 于 功能 实 
现 的 重要 性 。 没 有 数据 意识 的 产品 负责 人 ， 就 像 鼻 子 失 灵 的 缉毒 大 ， 在 日 常 工作 中 ， 只 能 靠 
自己 的 感觉 做 出 决策 。 这 样 会 产生 很 大 的 资源 浪费 , 尤其 是 在 竞争 激烈 的 互联 网 市 场 环境 中 。 

为 了 利于 统计 分 析 ， 团 队 必 须 在 一 开始 就 对 数据 日 志 格式 与 收集 标准 及 规则 进行 定 
义 ， 并 且 定 期 进行 宣 诽 。 标 准 定义 可 以 让 数据 的 收集 与 处 理 更 加 方便 ， 减 少 不 必 要 的 脏 数 
据 或 者 数据 分 类 错误 ， 从 而 提升 数据 处 理 的 时 效 性 和 准确 性 。 

数据 日 志 的 格式 本 身 并 不 复杂 , 通常 分 为 基础 信息 和 扩展 信息 。 基 础 信息 需要 描述 最 
基础 的 应 用 背景 信息 , 包括 4 个 W, 即 Who ( 哪 一 个 用 户 或 服务 )、When (什么 时 间 )、Where 
(什么 地 点 )、What (做 了 什么 )， 如 应 用 程序 基本 信息 、 事 件 时 间 、 级 别 、 环 境 信息 、 事 
件 代码 及 表示 位 ,扩展 信息 则 是 为 了 数据 更 好 的 扩展 性 , 以 应 对 不 同业 务 的 监测 统计 需求 ， 
通常 会 由 各 业务 团队 自行 定义 、 解 析 和 使 用 ， 图 13-3 给 出 了 一 个 扩展 信息 示例 。 

































































I 








13.2 ”数据 监测 体系 233 





格式 统一 约定 
] 使 用 1 级 分 隔 符 M001' 
说 明 
如 1.1 概 念 说 明 ， 由 客户 端 上 传 
事件 详情 记录 埋 点 的 具体 业务 ， 具 体 查 看 每 一 条 日 志 说 明 ， 由 客户 端 上 传 
事件 扩展 请 查看 下 面 的 事件 扩展 夫 说 明 ， 由 客户 端 上 传 
原子 封装 由 埋 点 服务 追加 ， 服 务 端 按 顺序 拼装 追加 ， 客 户 端 不 需 关 心 


record_time 由 埋 点 服务 追加 ， 服 务 端 记录 的 unix 时 间 蕉 ， 客 户 端 不 需 关心 


说 明 
。 埋 点 日 志文 件 中 的 格式 ， 请 按照 序号 从 小 到 大 拼 著 ， 按 上 表格 式 约定 统一 。 
。 埋 点 客户 端的 统一 请 求 方式 为 POST 请 求 : 
。 序号 1-3， 由 客户 端 上 传 ， 在 POST 里 面 拼 装 内 容 上 传 。 
5 序号 4-5， 由 埋 点 服务 追加 ， 原 子 封装 通过 请 求 un 后 面 的 参数 统一 上 传 。 
。 分 隔 符 : 
9 1 级 分 陋 符 ，\001'， 事 件 名 、 原 子 封 装 、 事 件 详 情 等 序号 1-5 之 问 ， 使 用 1 级 分 隔 符 。 





图 13-3 ”日 志 扩展 信息 示例 


事件 的 定义 与 日 志 标 准 需要 持续 更 新 。 随 着 业务 的 发 展 ， 功 能 不 断 变 化 ， 有 具体 的 事件 
采集 标准 与 日 志 格 式 以 及 所 含 内 容 也 会 随 之 产生 变化 。 例 如 ， 某 些 功能 合并 、 删 除 ， 那 么 
对 应 的 事件 与 日 志 也 需要 更 新 , 而 且 这 些 更 新 会 影响 到 原 有 的 统计 公式 或 分 析 报告 。 另 外 ， 
在 扩展 信息 中 的 一 些 字段 如 果 长 时 间 存 在 ， 团 队 应 该 考虑 将 其 定义 为 基础 信息 。 
13.2.3 ”监测 数据 体系 及 其 能 力 衡 量 

很 多 决策 都 依赖 于 大 量 的 数据 分 析 ， 因 此 这 些 数 据 质 量 尤为 重要 。 对 监测 数据 来 说 ， 
可 以 从 3 个 维度 来 衡量 。 

(1) 正确 性 ， 即 收集 到 的 数据 与 事实 的 一 致 性 。 

(2) 全 面 性 ， 即 收集 到 的 数据 信息 是 否 足以 支持 团队 做 出 诀 策 。 

(3) 及 时 性 ， 即 数据 的 发 生 到 能 够 支持 决策 所 需要 的 处 理 时 间 足 够 短 。 

在 团队 建立 之 初 ， 经 常会 遇 到 收集 到 的 数据 统计 结果 与 实际 业务 表现 不 一 致 的 情况 。 
这 值得 团队 花费 一 些 精力 重点 关注 。 我 们 可 以 通过 以 下 两 种 方式 来 验证 数据 质量 。 

(1) 依靠 业务 专家 的 经 验 来 判断 。 可 以 邀请 业务 专家 在 初期 建立 基本 数据 体系 。 

(2) 多 方 数据 对 比 验 证 。 多 方 数据 是 指数 据 源 既 可 以 来 自 企 业 外 部 的 数据 (如 行业 内 
的 一 般 数据 、 相 近 企 业 的 数据 表现 )， 也 可 以 是 来 自 系统 内 不 同 维度 的 数据 (如 浏览 数据 、 
订单 数据 与 财务 数据 等 的 对 比 ) 。 通 过 不 同 维度 数据 之 间 的 相互 印证 ， 发 现 质量 问题 ， 并 
逐步 改善 。 

及 时 性 是 业务 敏捷 的 重要 保障 前 提 ， 它 包括 数据 上 报 的 及 时 性 ,以 及 数据 处 理 的 及 时 
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性 。 每 当 对 某 些 功能 进行 变更 后 ， 我 们 都 希望 能 够 在 功能 上 线 后 ， 尽 早 知道 它 对 业务 相关 
数据 的 影响 ， 例 如 是 否 由 于 注册 页 面 的 功能 改进 ， 使 得 注册 用 户 增长 ， 是 否 因为 商品 详情 


大 所 大 


页 面 的 重新 设计 ， 更 多 的 用 户 可 以 做 出 快速 决策 ， 是 否 提升 了 订单 量 ， 等 等 。 
Facebook 的 实时 数据 分 析 与 存储 系统 
根据 Lior Abraham，John Allen 等 2012 年 发 表 的 题 为 “Scuba: Diving into Data at 
Facebook” 的 文章 所 述 ，Facebook 在 2012 年 的 实时 数据 分 析 与 存储 系统 Scuba 每 秒 吞 吐 
百 万 行 ， 每 天 处 理 百 万 次 查询 。 每 个 事件 的 处 理 延 迟 小 于 1 秒 。 从 数据 落地 日 志 收 集 服 
务 器 开始 ， 到 监测 人 员 能 够 在 仪表 盘 上 看 到 ， 仅 需要 1 秒 ， 如 图 13-4 所 示 。 











ri Scuba | 
一 Web UI | 
Web 服 务 器 状态 从 
Scribe SQL 接 口 
P| A 
后 端 系 统 数据 \、 ch 
| 警报 
导入 Hive 查 询 结 果 2012 年 Facebook 的 实时 数据 处 理 只 要 1 秘 


13-4 Facebook 2012 年 的 实时 数据 监测 系统 示意 图 
Scribe 是 日 志 收 集 服务 ，Scuba 是 数据 处 理 服务 集群 。 系 统 提 供 3 种 数据 使 用 方式 。 
一 是 通过 数据 仪表 盘 ， 可 能 直接 显示 周 数据 对 比 图 。 二 是 可 以 通过 可 视 化 方式 定制 查询 
条 件 ， 或 者 自己 脚本 ， 对 数据 进行 查询 ， 每 个 查询 的 时 间 少 于 1 秒 。 三 是 自动 告警 处 理 。 
图 13-$ 所 示 为 Facebook 代 码 变更 后 的 数据 变化 趋势 图 。 








Une Am 








图 13-5 2012 年 Facebook 的 实时 监测 仪表 盘 示 例 
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除 上 面 的 3 个 基本 衡量 维度 以 外 ， 监 测 系统 还 应 该 具有 抽样 能 力 ， 即 根据 实际 数据 量 
的 需要 ,工程师 可 以 配置 每 个 数据 采样 点 的 采样 密度 ， 并 快速 生效 。 这 有 利于 在 生产 运行 
正常 时 缩小 数据 总 量规 模 ， 在 生产 异常 时 也 能 快速 获得 最 详细 的 生产 日 志 信息 。 


13.3 ”问题 处 理 体系 


建立 了 数据 监测 系统 ， 接 下 来 就 是 要 从 这 些 监 测 数据 中 发 现 问题 ， 并 快速 解决 。 通 常 
发 现 问题 的 方式 有 两 种 : 一 是 人 工 判别 ;二 是 机 器 自动 发 现 。 面 对 大 量 的 监测 数据 ， 全 部 
依靠 人 工 处 理 是 不 现实 的 。 因 此 ， 通 常 先 由 机 器 根据 各 种 规则 进行 判断 ， 尽 可 能 多 地 自动 
发 现 生 产 中 的 疑似 问题 ， 无 法 自动 处 理 时 ， 就 作为 一 个 “告警 "， 生 成 一 个 工 单 ， 发 送 给 
指定 的 问题 接收 入 。 


13.3.1 告警 海洋 与 智能 化 管理 


在 国内 某 互 联网 公司 中 ， 有 一 位 运 维 人 员 每 天 接 到 告警 信息 在 6000 条 以 上 。 如 果 每 个 
都 需要 看 一 下 的 话 ， 平 均 每 分 钟 要 查看 4 条 报警 信息 ， 一 天 24 小 时 待命 。 然 而 ， 虽 然 
信息 已 经 多 如 牛 毛 ， 但 是 ， 每 当 出 现 生 产 事故 以 后 ， 事 故 复 盘 分 析 必 有 两 个 行动 项 : 
一 是 梳理 当前 日 志 监 测 和 告警 点 ， 把 相关 人 全 部 配置 一 遍 ， 生 怕 漏 掉 任 何 一 个 人 ;二 是 加 
入 更 多 的 监测 点 和 报警 。 

一 方面 是 告警 数量 多 , 希望 减少 告警 ， 另 一 方面 是 害怕 出 事 了 没有 告警 ， 只 能 加 入 更 
多 的 告警 。 而 最 终 的 胜利 者 通常 都 是 后 者 。 事 实 上 ， 很 大 一 部 分 告警 信息 都 会 被 接收 者 直 
接 忽略 ， 看 都 不 看 。 原 因 主要 有 两 点 。 

(1) 告警 信息 的 第 一 处 理 人 不 是 自己 。 例 如 ， 某 次 生产 事故 复 盘 后 ， 认 为 该 类 告警 应 
该 不 只 给 应 用 运 维 的 同事 , 还 应 该 给 相关 的 开发 负责 人 , 而 且 开发 负责 人 最 好 有 一 个 备份 ， 
以 防 万 一 。 这 样 ， 一 个 告警 点 至 少 有 3 个 接收 者 。 

(2) 告警 信息 是 一 个 预备 告警 ， 并 不 需要 马上 处 理 。 例 如 某 互 联网 公司 的 生产 系统 出 
现 了 磁盘 空间 告警 ， 因 磁盘 空间 不 足 导 致 事故 。 经 过 复 盘 后 发 现 ， 原 定 的 规则 是 : 磁盘 空 
间 不 足 的 告警 国 值 下 限 是 50 GB。 在 正常 情况 下 ， 该 服务 器 上 的 数据 增 量 是 40 GB/ 天 。 按 
这 个 量 级 来 计算 ， 当 告警 发 生 时 ， 有 足够 的 时 间 〈 约 为 24 小 时 ) 来 处 理 它 。 然 而 ， 这 次 事 
件 由 于 特殊 原因 ， 在 很 短 的 时 间 内 数据 就 超过 了 50 GB， 导 致 磁盘 空间 不 足 事故 发 生 。 于 
是 ， 为 了 避免 再 次 出 现 类 似 情 况 ， 运 维和 人 员 又 增加 了 一 个 新 的 预备 告警 ， 羡 值 下 限 是 200 
GB。 因 此 ， 当 收 到 告警 时 ， 看 了 一 眼 ， 心 里 有 数 就 行 了 ， 并 不 需要 马上 处 理 。 

当然 , 我 们 并 不 排除 很 多 告警 的 正确 性 和 真实 性 , 但 我 们 也 需要 提高 告警 信息 在 另外 
两 个 维度 的 质量 。 一 是 及 时 性 ， 这 一 点 的 重要 性 无 须 解释 ， 二 是 告警 信息 的 可 操作 性 。 也 
就 是 说 ， 当 收 到 告警 信息 后 ， 接 警 人 应 该 可 以 针对 这 个 告警 做 出 相应 的 操作 ， 否 则 告警 信 
息 就 如 同 垃圾 短信 一 样 ， 应 该 将 其 屏蔽 ， 因 为 它 会 令 工作 效率 降低 。 而 且 ， 一 旦 真正 的 告 
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警 信息 济 没 在 大 量 无 须 处 理 的 “ 伪 ” 告 警 信息 之 中 时 ， 很 容易 酿 成 生产 事故 。 我 们 可 以 从 
4 个 方面 来 缓解 “告警 海洋 ”的 问题 。 

(1) 通过 关联 分 析 ， 让 监控 点 离 问 题 发 生地 更 近 。 因 为 关联 分 析 是 指 目前 后 端 服 务 已 
开始 向 微服 务 方向 发 展 ， 所 以 调用 链 比较 长 。 有 时 某 个 末端 服务 的 问题 是 由 前 端 服务 造成 
的 ， 而 且 前 端 服务 也 可 以 监测 到 这 个 异常 ， 那 么 就 应 该 在 前 端 服务 设置 监测 点 ， 而 不 是 在 
末端 服务 加 入 监测 点 。 

(2) 通过 动态 阅 值 设 定 合 理 的 告警 。 最 初 我 们 设 定 病 值 时 可 能 都 会 写 上 一 个 固定 的 数 
值 。 这 个 固定 的 数值 如 果 设 定 太 高 ， 那 么 问题 已 经 出 现 了 ， 可 能 还 没有 触发 告警 ， 如 果 设 
定 得 太 低 ， 那 么 可 能 会 导致 无 效 的 告警 ,浪费 员工 的 时 间 和 注意 力 。 因 此 ,我 们 可 以 通过 
一 些 算法 来 动态 调整 闵 值 。 例 如 ， 对 于 磁盘 空间 不 足 的 那个 告警 闪 值 ， 我 们 就 可 以 根据 这 
台 服 务 器 上 当前 磁盘 空间 占有 率 的 增长 速度 来 动态 调整 病 值 ， 增 长 速度 慢 , 我 们 可 以 设置 
为 40 GB ， 如 果 增 长 速度 快 ， 我 们 可 以 设置 为 200 GB。 这 样 ， 我 们 就 不 需要 像 上 面 的 那个 
例子 那样 ， 设 置 两 个 告警 点 了 。 当 然 ， 确 保 算法 的 准确 性 需要 一 定时 间 的 观察 和 积累 ， 以 
及 大 数据 分 析 。 

(3) 定期 梳理 告警 设置 ， 清 理 不 必要 的 告警 。 清 理 不 必要 的 告警 包括 两 方面 的 含义 。 
一 是 告警 事件 本 身 是 不 必要 的 。 这 种 情况 多 发 生 于 软件 功能 发 生变 化 后 ， 原 来 有 意义 的 告 
警 变 得 不 再 有 意义 。 二 是 接收 人 根本 没 必要 接收 到 这 个 告警 。 

(4) 通过 人 工 智 能 动态 解除 告警 。 这 是 目前 运 维 领域 的 一 个 新 热点 。 希 望 通过 人 工 知 
能 算法 ， 找 出 生产 环境 不 同事 件 之 间 的 一 些 规律 性 关联 关系 。 这 样 可 以 更 早 识别 问题 ， 早 
发 告警 ， 甚 至 自动 处 理 问题 ， 而 不 发 告警 。AIOps 领 域 现在 还 处 于 探索 阶段 ， 尚 未 能 实现 
在 行业 内 的 大 规模 应 用 。 

通过 不 断 努 力 ,我 们 可 以 将 告警 数量 控制 在 一 定 的 水 平 , 但 很 难 消除 告警 。 对 于 那些 
常见 告警 ， 我们 可 能 已 经 有 了 应 对 之 法 ,真正 需要 花 时 间 处 理 的 是 那些 以 前 没有 出 现 过 的 
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异常 告警 ， 因 为 它们 很 可 能 是 “生产 问题 ”。 
13.3.2 ”问题 处 理 是 一 个 学 习 过 程 


“生产 问题 ”的 处 理 也 是 一 个 产品 研发 管理 流程 的 重要 环节 。 假 如 疫 有 恨 好 的 处 理 流 
程 ， 很 可 能 会 出 现 更 多 的 管理 问题 。 通 常 来 说 ， 处 理 过 程 如 图 13-6 所 示 。 

在 团队 规模 不 大 时 , 这 个 处 理 流程 都 是 依靠 人 工 执 行 的 , 主要 通过 电子 邮件 、IM 工 具 
或 者 “大 嗓门 (号)” 进 行 。 一 旦 人 员 规 模 变 大 ， 系 统 变 得 复杂 ， 这 个 过 程 就 变 得 非常 耗 
时 。 例 如 ， 由 于 问题 定位 点 判断 不 准 ， 经 常 需要 在 几 个 不 同 团队 之 间 移 交 处 理 ， 在 交接 过 
程 中 ， 经 常 丢失 问题 上 下 文 。 为 了 提高 效率 ， 通 常 需要 将 该 流程 中 人 工 部 分 尽 可 能 通过 自 
动 化 方式 来 解决 ， 包 括 问 题 单 的 自动 跟踪 、 相 关 信 息 的 附加 记录 、 整 个 处 理 过 程 的 时 效 度 
量 、 多 种 及 时 的 通知 机 制 以 及 问题 反馈 的 升级 机 制 等 。 这 就 需要 一 个 工 单 系 统 来 支持 。 而 
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且 ， 当 我 们 对 问题 进行 复 盘 时 ， 有 了 这 样 一 个 工 单 系统 ， 可 以 为 我 们 及 时 正确 地 提供 很 多 
过 程 信 息 。 


名 六 他 


让 一 当 


1 2 3 二 
问题 报告 初步 定位 并 通知 让 问题 解 号 人 解决 
处 理 人 员 


图 13-6 ”生产 问题 的 处 理 流程 


在 很 多 团队 中 ， 问 题 复 盘 会 常常 被 视 为 “ 追 责 会 ， 会 议 气 氛 剑 拔 努 张 。 在 一 个 学 习 
二 ， 是 一 个 最 有 效 的 学 习 方 法 。 复 盘 时 ， 所 有 相 
关 的 人 一 起 对 照 结果 ， 回 顾 过 程 ， 进 行 得 失 分 析 和 规律 总 结 。 这 是 一 个 最 好 的 相互 学 习 的 
过 程 ， 对 每 个 人 都 是 一 个 提高 机 会 。 复 盘 总 结 出 来 的 规律 ， 对 于 后 来 者 再 处 理 类 似 的 事情 
时 是 一 个 “菜谱 ”一 样 的 行动 指南 ， 也 是 一 个 组 织 最 好 的 知识 传承 ， 可 以 最 大 限度 地 帮助 
后 来 者 进步 。 

复 盘 活动 有 一 个 最 重要 的 前 提 ， 那 就 是 : 要 有 详细 的 问题 处 理 过 程 记 录 ， 以 及 整个 过 
程 中 的 各 方 参与 者 (包括 产生 问题 移交 的 参与 方 ) 的 全 面 参 与 。 对 于 复 盘 过 程 中 有 疑问 的 
点 ， 甚 至 应 该 进行 二 次 场景 复 现 ， 以 便 得 到 更 好 的 预防 和 根源 解决 方案 。 


13.4 生产 环境 测试 


生产 环境 是 独一无二 的 。 以 “预先 质量 验证 ”为 目的 建立 的 非 生产 环境 永远 无 法 保证 

发 现 生产 环境 中 可 能 出 现 的 所 有 问题 。 随 着 软件 快速 发 布 诉求 的 提升 ， 以 及 测试 场景 不 可 

枚 举 性 概率 的 提高 ， 非 生产 环境 的 测试 场景 越 来 越 显得 不 充分 。 因 此 ， 人 们 开始 考虑 在 不 
影响 生产 的 前 提 下 ， 如 何在 生产 环境 中 进行 测试 。 


13.4.1 测试 活动 扁平 化 趋势 


在 传统 的 瀑布 软件 开发 方法 中 ， 测 试 执行 和 决策 活动 通常 集中 在 软件 研发 周期 的 中 
部 。 然 而 ， 随 着 现代 软件 交付 频率 的 不 断 加 快 ， 这 种 情况 出 现 了 变化 。 很 多 团队 的 测试 活 
动 开 始 向 左右 两 侧 移 动 ， 如 图 13-7 所 示 。 

“测试 左 移 ”( 或 者 叫 “ 测 试 前 移 ") 是 指 测 试 人 员 更 早 且 更 积极 地 参与 到 软件 项 目前 
期 各 阶段 活动 中 ， 例 如 更 早 地 参与 探索 环 活动 ， 在 开发 功能 之 前 就 定义 相关 的 测试 用 例 ， 
测试 执行 任务 也 在 向 左 移动 ， 表 现 为 ， 在 越 来 越 多 的 软件 团队 中 ,测试 角色 开始 拥抱 “ 增 
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量 测试 ， 即 在 软件 集成 测试 之 前 ， 就 开始 针对 单个 已 开发 完成 的 功能 集 进行 质量 验证 ， 
提前 发 现 质 量 风 险 。 尽 管 这 种 “ 增 量 测试 ”无 法 发 现 全 部 质量 问题 , 但 可 以 减少 集成 测试 
阶段 的 时 间 压 力 ， 如 图 13-8 所 示 。 同 时 ， 还 会 通过 频 葵 运行 各 层级 的 自动 化 测试 ， 确 保 软 
件 的 交付 质量 ， 最 终 缩短 软件 的 研发 周期 ， 提 高 发 布 频率 。 


参与 度 及 
测试 活动 密度 





一 
一 
一 
一 
一 一 
一 
一 
一 





需 架 模 ” 集 系 发 运 时 间 

求 构 块 成 统 布 人知 

分 设 开 测 济 监 

村 计 发 斌 试 控 

图 13-7 ”测试 活动 的 左右 移动 
特性 ! 开发 等 竺 
特性 2 开发 等 和 | 测试 
特性 3 开发 . 
特性 1 开发 集 测试 
特性 2 开发 成 测试 测试 
集 

特性 3 开发 成 











图 13-8 ”测试 左 移 




















“测试 右 移 ”是 指 通过 各 种 技术 手段 ， 将 一 部 分 质量 验证 工作 放 在 软件 发 布 以 后 。 这 
种 测试 右 移 有 一 点 儿 “ 无 奈 "。 因 为 互联 网 软件 产品 的 测试 与 原来 的 企业 内 部 应 用 的 软件 
测试 有 显著 的 不 同 ， 即 无 法 穷 举 性 。 企 业内 部 应 用 软件 的 受众 有 限 ， 环 境 相 对 可 控 ， 最 不 
济 也 可 以 使 用 行政 手段 干预 ， 而 且 不 存在 用 户 流失 的 风险 。 但 是 ， 互 联网 产品 的 情况 有 所 
不 同 。 每 个 人 的 计算 机 或 手机 上 都 安装 着 不 同 的 软件 ， 手 机 硬件 及 操作 系统 也 有 很 多 种 组 
合 。 这 使 得 想 凭 借 公 司 一 己 之 力 ， 以 穷 举 方式 进行 所 有 相关 场景 测试 成 为 一 个 不 可 能 完成 
的 任务 。 因 此 ， 大 家 也 越 来 越 依赖 于 生产 环境 上 的 质量 验证 。 从 某 种 程度 上 来 说 ，A/B 测 
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试 也 是 生产 环境 中 进行 的 一 种 测试 形式 。 它 的 主要 目标 是 验证 业务 设计 方案 的 有 效 性 ， 而 
非 某 个 软件 功能 的 执行 正确 性 。 

目前 ， 测 试 右 移 的 现象 多 见于 软件 产品 中 的 展示 性 功能 (software for show) ， 即 软件 
功能 更 多 地 倾向 于 内 容 展现 ， 例 如 搜索 软件 、 拍 照 软件 、 商 品 展示 、 新 闻 推 荐 和 游戏 性 软 
件 等 。 即 便 这 类 功能 出 现 一 些 问题 ， 会 对 软件 品牌 有 一 定 影响 ， 但 只 要 及 时 发 现 ， 及 时 修 
复 ， 就 不 会 对 用 户 造成 本 质 性 损失 或 严重 影响 。 

对 事务 性 软件 (software for transaction) 或 面向 企业 的 收费 软件 ， 以 及 问题 修复 成 本 
较 高 的 软件 (例如 硬件 设备 中 的 固件 ) 来 说 ， 一 旦 生产 环境 出 现 问题 ， 会 带 来 比较 大 的 损 
失 。 因 此 ， 软 件 团队 不 会 冒险 将 功能 验证 的 活动 右 移 ， 而 是 有 强烈 的 动机 将 测试 活动 尽 可 
能 左 移 ， 同 时 加 强 右 侧 的 监测 能 


13.4.2 ”生产 环境 中 的 测试 


我 们 应 该 鼓励 质量 保障 部 门将 生产 环境 的 测试 也 纳入 他 们 的 日 常 质量 保障 工作 中 。 有 
一 种 常见 的 生产 环境 质量 检测 手段 ， 称 为 “生产 巡 检 ”， 即 对 生产 环境 中 的 后 台 服 务 进行 
定期 的 功能 验证 ， 以 确保 该 后 台 服 务 仍 旧 对 外 正常 提供 服务 ， 并 且 处 理 的 结果 是 正确 的 。 
通常 的 做 法 是 : 创建 一 个 覆盖 应 用 程序 主要 功能 的 日 常 健康 检查 清单 ， 对 生产 环境 进行 例 
行 测试 和 检查 软件 服务 的 质量 。 这 种 测试 方式 与 监测 不 同 ， 它 们 是 由 软件 团队 自行 安排 的 
质量 验证 工作 ， 并 且 定 期 执行 。 因 为 这 是 一 些 例 行 验证 ， 所 以 应 该 被 自动 化 执行 。 这 类 测 
试 中 最 典型 的 就 是 接口 测试 。 很 多 团队 开始 将 一 些 自动 化 接口 测试 的 用 例 放 在 生产 环境 
中 ， 周 期 性 执行 ， 以 代替 手工 检查 。 

这 类 生产 环境 上 的 质量 保障 工作 应 该 遵循 以 下 原则 。 

(1) 创建 自用 的 测试 数据 ， 确 保 不 污染 真实 用 户 的 数据 。 
(2) 使 用 的 测试 数据 尽 可 能 真实 。 
(3) 不 要 修改 真实 用 户 的 数据 。 
(4) 创建 测试 专用 的 用 户 访问 赁 证， 登录 生产 环境 。 


13.4.3 混沌 工程 


混沌 工程 《chaos engineering) 是 指 通 过 在 生产 环境 中 注入 “问题 "， 从 而 发 现 生产 环 
境 系 统 性 弱点 ， 并 进行 系统 性 改进 的 方法 或 手段 。 其 目标 是 不 断 提升 生产 环境 面 对 任何 变 
更 的 可 靠 性 。 这 与 疫苗 注射 类 似 ， 向 系统 中 注入 一 些小 剂量 的 “病毒 " ， 目 的 是 让 身体 建 
立 对 它 的 抵抗 力 ， 从 而 使 身体 获得 免疫 性 。 

混沌 工程 并 不 是 指 一 切 都 应 该 随机 进行 , 尤其 是 当 生 产 系 统 的 稳定 性 并 不 很 高 时 。 混 
沌 工程 启动 初期 时 ， 可 能 只 是 在 限定 的 范围 和 时 间 内 注入 已 知 的 问题 〈 而 且 已 知 解 决 方 
案 )， 从 而 验证 已 知 解决 方案 是 否 可 以 正常 工作 。 
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2013 年 , 我 曾经 使 用 这 种 方式 寻找 生产 环境 中 应 急事 件 的 处 理 流 程 漏 洞 。 当 时 是 为 了 
验证 一 个 负责 PC 客户 端 互联 网 软件 的 团队 研发 管理 流程 中 ,应急 处 理 流程 是 否 可 靠 。 我 们 
在 一 定 范围 内 选择 出 一 批 机 器 , 并 在 一 个 时 间 段 内 , 向 这 批 机 器 随机 下 发 带 有 问题 的 模块 。 
演习 设计 时 ， 我们 决定 加 入 两 个 随机 因素 : 一 是 在 指定 范围 内 随机 选择 机 器 ;二 是 在 指定 
范围 内 随机 选择 时 间 。 经 过 这 次 演习 ， 我 们 发 现 了 应 急流 程 中 的 两 个 耗 时 操作 。 这 种 方式 
的 特点 是 : 事先 通知 ， 并 做 好 事前 计划 。 

当 团 队 已 经 具备 “为 失败 而 设计 ”(design for failure) 的 意识 后 ， 就 可 以 像 网 飞 公司 
(Netflix) 那样 ， 采 取 更 加 激进 的 方式 。 网 飞 公司 开发 了 一 系列 生产 环境 的 测试 工具 ， 被 称 
为 “猿人 部 队 ”(Simian Army)。 这 些 工 具 运行 在 亚马逊 网 络 服务 (Amazon Web Services， 
AWS) 基础 架构 上 , 专门 用 于 处 理 各 种 云 计算 问题 和 挑战 ， 用 以 帮助 确保 网 络 健康 ， 促 进 
高 效 流量 管理 ， 并 找 出 系统 中 存在 的 安全 问题 。 例 如 ，Chaos Gorilla 用 来 模拟 AWS 的 某 个 
区 (zone) 出 现 问 题 ，Chaos Kong 则 是 用 来 模拟 AWS 的 某 个 大 区 (region， 如 北美 或 欧洲 ) 
出 现 问 题 ，Latency Monkey 是 人 为 制造 调用 延迟 ， 用 来 模拟 服务 降级 ， 看 依赖 这 些 服务 的 
模块 是 否 能 正确 做 出 反应 。 还 有 其 他 类 型 的 工具 ， 如 查找 运行 不 良 的 AWS 实 例 , 假如 负责 
维护 该 AWS 实 例 的 人 没有 及 时 修复 ， 就 自动 关闭 它 4 

这 种 “问题 注入 ”(Failing Injection) 式 的 主动 检测 使 得 软件 工程 师 在 架构 设计 时 就 需 
要 考虑 一 些 向 见 的 失败 问题 。 在 云 基础 设施 时 代 ， 这 基 一 个 主动 发 现 未 知 问题 极 其 重要 的 
工作 方式 。 当 然 ， 这 种 做 法 也 会 增加 在 云 基 础 设施 上 的 投入 成 本 。 


13.5 ”向 东 ， 还 是 向 西 


如 图 13-9 所 示 ， 快 速 验证 环 中 ， 我 们 将 精炼 后 的 试验 方案 变 为 可 以 运行 的 软件 ， 部 署 
到 生产 环境 ， 并 且 收 集 了 运行 结果 和 用 户 反 馈 。 现 在 是 要 决定 下 一 步 “ 向 东 ， 还 是 向 西 ” 
的 时 刻 了 。 我 们 将 完成 第 一 个 业务 闭环 。 
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图 13-9 ”向 东 ， 还 是 向 西 
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经 过 分 析 总 结 ， 假 如 收集 的 业务 度量 数据 符合 我 们 在 价值 探索 环 中 定义 的 目标 预期 ， 
就 能 够 确认 我 们 在 价值 探索 环 所 做 出 的 假设 是 正确 的 。 此 时 ， 我 们 就 可 以 回 到 探索 环 的 起 
点 ， 选 择 下 一 个 业务 挑战 。 

如 果 收 集 的 结果 不 符合 预期 ， 也 没有 什么 好 和 气 鳃 的 ， 我 们 已 经 用 最 快 的 速度 得 到 了 
结果 。 现 在 ， 只 要 和 团队 一 起 分 析 一 下 ， 为 什么 结果 与 我 们 的 预期 不 一 致 ， 是 否 需 要 对 
这 个 方案 再 一 次 进行 微调 ， 还 是 从 备 选 方案 集中 再 选 出 一 个 试验 方案 ， 继 续 驱 动 这 个 快 
速 验 证 环 。 

当然 ,我 们 也 有 另外 一 种 可 能 性 ， 即 在 这 次 验证 环 的 运行 过 程 中 ,我 们 发 现 了 新 的 业 
务 知识 。 而 这 些 新 知识 说 明 , 价值 探索 环 中 精炼 环 市 产生 的 所 有 备 选 方 案 都 是 错误 的 ,我 
们 需要 带 着 刚刚 学 到 的 知识 重新 开始 价值 探索 环 之 旅 。 


13.6 小 结 


生产 环境 的 监测 范围 包括 3 个 层次 ， 它 们 分 别 是 “基础 监测 ” “应 用 监测 ”和 “业务 监 
测 "。 尽 管 根 据 每 一 层次 的 特点 ， 监 测 数据 的 采集 方式 有 所 不 同 ， 但 是 其 处 理 流 程 基本 一 
致 。 每 个 监测 体系 都 包括 数据 收集 、 上 报 、 整 理 、 分 析 、 展 现 与 决策 这 几 个 环节 。 而 对 监 
测 系统 能 力 的 衡量 有 3 个 维度 ， 即 数据 的 准确 性 、 全 面 性 与 及 时 性 。 而 抽样 能 力 是 提高 监 
测 灵活 性 、 节 约 资 源 、 提 升 用 户 体验 的 一 种 有 效 方法 。 
告警 处 理 是 研发 人 员 和 运 维 人 员 的 常规 工作 , 但 是 ,如果 告警 过 多 也 会 成 为 工作 中 的 
困扰 ， 降 低 工 作 产 出 。 因 此 ， 我 们 应 该 不 断 对 告警 点 的 设置 与 国 值 计 算 方 式 进行 优化 ， 从 
而 尽 可 能 提升 有 效 告 警 率 。 一 旦 告警 成 立 ， 就 需要 启动 问题 处 理 流程 。 这 个 流程 的 最 后 两 
个 环节 “ 根 因 分 析 ” 和 “根源 解决 "， 是 学 习 型 组 织 的 重要 特征 。 

随 着 发 布 频率 的 提高 ,测试 场景 的 复杂 性 提高 , 越 来 越 多 的 团队 开始 找寻 方法 在 生产 

环境 上 进行 软件 测试 ， 这 被 称 为 测试 活动 右 移 。 这 种 右 移 目前 多 发 生 于 展示 性 软件 ， 这 类 
软件 出 错 后 的 成 本 和 影响 相对 较 少 。 而 对 那些 交易 性 软件 或 回收 成 本 较 高 的 软件 来 说 ， 测 
试 左 移 的 趋势 也 比较 明显 。 
右 移 的 测试 主要 有 两 种 类 型 。 一 是 将 测试 用 例 在 生产 环境 上 自动 运行 。 二 是 混沌 工程 ， 
即 通 过 注入 “问题 ” 发 现 生 产 环境 的 潜在 稳定 性 问题 。Netflix 公 司 开 发 了 一 系列 破坏 性 测 
试 工具 (Simian Army) 可 以 促使 工程 师 在 软件 设计 与 开发 之 时 ， 就 提前 考虑 各 种 失败 的 
可 能 性 ,这 被 称 为 “为 失败 而 设计 (Design for Failure)”， 从 而 提高 生产 环境 的 软件 服务 稳 
定性 ， 为 用 户 提供 更 好 的 服务 体验 。 

当 收集 到 真实 的 数据 反馈 以 后 , 我 们 就 可 以 用 来 印证 我 们 在 价值 探索 环 中 所 提出 的 假 
设 或 目标 ， 并 通过 主动 关联 分 析 ， 最 终 确 定 是 继续 进行 更 多 的 试验 ， 还 是 重新 再 选择 一 条 
新 的 “路 ”。 
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章 讲述 的 是 一 个 大 型 互联 网 桌面 产品 团队 历时 一 年 左右 的 持续 交付 改进 案例 。 
我 们 无 法 记录 该 团队 在 整个 过 程 中 做 过 的 每 一 个 改进 决策 ,但 是 希望 读者 能 够 
了 解 主要 脉络 ， 以 及 解决 问题 的 思路 ， 从 而 可 以 应 用 到 日 常 改进 工作 当中 。 


14.1 简介 

















本 案例 发 生 在 一 家 大 型 互联 网 公司 , 该 公司 旗下 有 多 条 产品 线 。 本 案例 发 生 在 其 中 一 
条 互联 网 业务 产品 线 上 ， 其 产品 形态 是 面向 大 众 消费 者 的 Windows 桌 面 产品 。 整 个 产品 线 
有 300 多 人 ， 包 含 产 品 策划 、 产 品 运营 、 软 件 开发 质量 保障 以 及 少量 的 应 用 运 维 人 员 ， 
是 一 个 全 功能 团队 ， 负 责 该 产品 在 市 场 上 的 表现 ,全 权 对 业务 指标 负责 。 经 过 历时 一 年 的 
研发 管理 改进 ， 取 得 了 不 错 的 效果 。 改 进 前 后 的 对 照 如 表 14-1 所 示 。 

































































表 14-1 ”改进 前 后 的 对 照 
对 比 项 改 进 前 改 进 后 
系统 结构 “ 泥 球 ”代码 微 核 架 构 
组 织 架 构 职能 型 组 织 业务 型 组 织 
正式 版 本 : 4 周 (不 延期 ) 
: 布 频率 :6 上 盾 十 延 E 
发 布 频率 正式 版 本 : 6 周 (有 时 延期 ) ee 
产品 基本 质量 崩溃 率 下 降 90% 








回顾 整个 改进 过 程 ， 可 以 总 结 为 4 个 阶段 。 

(1) 架构 解 看 阶段 : 通过 “拆迁 者 ”模式 对 整个 Windows 客 户 端 软件 的 系统 架构 进行 
改造 ， 成 为 “ 微 核 架构 模式 ”( 详 见 第 5 章 ) ， 解 决 那些 因 代码 耦合 严重 ， 导 致 多 人 并 行 开 
发 的 效率 与 质量 低下 的 问题 。 

(2) 组 织 解 看 阶段 :打破 各 职能 部 门 之 间 的 “ 墙 *"， 将 原 有 按 职能 划分 的 组 织 结构 进 
行 重组 ,建立 了 以 业务 为 导向 的 多 角色 全 功能 团队 ,促进 团队 内 部 的 业务 小 闭环 ,提升 团 
队 的 整体 效率 。 

(3) 研发 流程 再 造 阶段 : 制订 新 的 产品 研发 与 发 布 策略 ， 改 进 多 团队 的 代码 分 支管 
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理 方式 。 


(4) 自动 化 提升 效率 阶段 : 通过 自动 化 工具 建设 ， 提 升 各 环节 的 工作 效率 。 
这 4 个 阶段 分 别 涉 及 软件 架构 、 组 织 机 制 与 持续 交付 基础 设施 改造 3 个 方面 。 


14.1.1 





在 改进 之 前 ， 该 产品 已 有 4 年 历史 ， 并 经 历 了 一 个 快速 发 展 过 程 ， 已 经 有 数 亿 产品 安 
装 量 。 随 着 开发 团队 人 数 快 速 增长 ， 在 时 间 进 度 压力 之 下 ,软件 产品 本 身 也 欠 下 了 很 多 技 
术 债 。 产 品 发 展 进 入 平缓 期 后 ， 团 队 士 气 有 些 低落 。 


1. 








团队 组 织 结构 


该 产品 团队 采用 典型 的 职能 组 织 架 构 ， 每 个 职能 部 门 都 有 自己 的 职责 。 


2. 


产品 中 心 : 产生 更 多 更 有 效 的 想法 和 创意 ， 为 用 户 提供 价值 ， 收 获 更 多 的 用 户 
认可 。 

开发 中 心 : 确保 产品 中 心 提出 的 需求 尽快 得 到 高 质量 的 实现 。 

测试 中 心 : 确保 开发 中 心 产 出 的 软件 尽快 得 到 测试 ， 保 证 交 给 用 户 使 用 的 每 个 版 
本 安全 且 稳定 。 

运营 中 心 : 确保 测试 通过 的 产品 及 时 上 线 ， 保 持 生产 环境 稳定 ， 并 保持 与 用 户 的 
联系 ， 提 高 用 户 满意 度 。 

设计 中 心 : 确保 产品 风格 一 致 ， 确 保良 好 的 用 户 体验 。 

项 目 管理 组 .确保 各 部 门 能 够 高 效 协作 。 

版 本 研发 节奏 


该 产品 的 发 布 分 为 “大 版 本 ”和 “hotfix 版 本 ”。 大 版 本 是 包含 很 多 新 功能 的 版 本 ， 每 
个 版 本 的 研发 周期 较 长 , 采用 典型 的 瀑布 软件 开发 流程 , 其 流程 的 阶段 定义 如 图 14-1 所 示 ， 
当 需 求 文档 全 部 评审 完毕 ， 开 发 团队 才 启 动 该 版 本 开发 。 每 个 版 本 从 启动 开发 工作 到 发 布 
的 整个 周期 约 为 29 个 工作 日 。hotfix 版 本 是 指 为 了 修复 线 上 严重 问题 而 紧急 发 布 的 问题 修 
订 版 本 。 

















| ,。| 合 入 i 发 
需求 分 析 支线 开发 支线 测试 | 联 简 系统 测试 币 
下 一 个 版 本 的 需求 准备 、 分 析 与 评审 支线 开发 








图 14-1 本 案例 的 产品 版 本 研发 节奏 


该 产品 有 6 大 功能 ，Windows 桌 面 客户 端的 开发 人 员 约 有 80 人 ， 被 分 成 6 个 开发 小 组 ， 
每 个 开发 小 组 负责 其 中 一 个 功能 集 的 特性 开发 工作 。 
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整个 团队 采用 的 分 支 策略 是 “团队 分 支 开 发 ， 主 干 发 布 ” 的 模式 ， 如 图 14-2 所 示 (本 
章 中 的 “支线 ” 均 指 “ 团 队 分 支 ”)。 


发 布 分 支 


团队 分 支 1 


团队 分 支 6 





手工 合 入 ， 联 调 、 系 统 测试 、 修 复 bug 





人 
/ \ 


















图 14-2 ”产品 线 早期 的 团队 分 支 发 布 策 略 


下 面 介绍 这 一 发 布 策略 的 具体 工作 模式 。 


支线 开发 : 当 某 个 版 本 的 需求 评审 完毕 以 后 ， 每 个 开发 小 组 都 从 当前 代码 库 的 主 
干 上 拉 出 一 条 分 支 ， 各 自 开发 自己 的 相关 功能 模块 ， 时 间 大 约 需 要 10 个 工作 日 。 
支线 测试 ， 当 前 版 本 功能 基本 开发 完成 ， 小 组 在 自己 支线 上 进行 测试 ,修复 缺陷 。 
时 间 大 约 需 要 5 个 工作 日 。 

合 入 联 调 : 6 个 开发 小 组 根据 之 前 预先 计划 的 谷 入 烦 序 ， 依 次 合 和 人 各自 支 线 上 的 代 
码 ， 并 进行 联 调 ， 直 至 质量 基本 达标 ( 即 确保 没有 严重 阻碍 测试 工作 的 缺陷 ， 包 
括 程 序 无 法 启动 、 主 要 特性 不 工作 、 本 次 版 本 的 主要 功能 未 完成 等 )。 这 一 阶段 需 
要 2 一 3 个 工作 日 。 

系统 测试 : 当 合 入 联 调 完 成 后 ， 再 执行 三 轮 测试 。 第 一 轮 为 全 面 测 试 ， 发 现 尽 可 
能 多 的 问题 ， 并 通知 开发 人 员 修改 ， 第 二 轮 为 验证 测试 ， 不 断 验证 开发 人 员 已 修 
改 的 缺陷 ， 第 三 轮 为 回归 测试 ， 选 择 重 要 场景 用 例 及 重要 级 以 上 的 缺陷 进行 最 后 
验证 。 在 此 期 间 ， 开 发 人 员 不 断 修复 测试 人 员 发 现 的 缺陷 ， 直 至 各 方 评估 ， 质 量 
达到 对 外 发 布 的 标准 才 可 以 上 线 。 系 统 测 试 大 约 需 要 10 个 工作 日 。 

版 本 发 布 : 这 里 的 版 本 发 布 是 指 实现 整个 的 版 本 发 布 流程 ， 包 括 审 批 、 上 传 、 配 
置 、 生 效 ， 直 至 第 一 个 用 户 收 到 新 版 本 ， 并 不 包括 全 部 的 灰 度 放量 过 程 。 这 个 过 
程 需要 1 天 时 间 。 











并 不 是 所 有 的 产品 版 本 都 能 够 按 这 一 流程 ， 按 时 保质 完成 。 虽 然 每 个 人 都 努力 工作 ， 
经 常 加 班 到 深 夜 ， 但 仍旧 会 出 现 “ 两 三 个 月 才能 发 布 一 个 全 网 正式 版 本 ”的 情况 ,而且 整 
个 团队 都 感觉 疲 备 不 堪 。 

14.1.2 ”改进 后 状态 


经 过 近 一 年 的 时 间 跨 度 ， 整 个 产品 线 从 团队 组 织 、 软 件 架 构 到 研发 流程 上 都 做 出 了 非 
常 大 的 调整 。 
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1. 团队 组 织 结构 

该 产品 团队 采用 业务 导向 的 组 织 架构 。 该 产品 部 门 的 400 多 人 被 分 成 6 个 业务 中 心 和 5 
个 职能 部 门 。 每 个 业务 子 部 门 负责 自己 的 功能 模块 集 ， 有 自己 的 业务 子 目 标 ， 由 产品 人 员 
和 开发 人 员 组 成 。5 个 职能 部 门 包括 测试 中 心 、 后 台 开 发 中 心 、 产 品 设计 中 心 、 运 营 组 、 
项 目 管理 小 组 。 原 来 的 项 目 管理 组 一 分 为 二 ， 一 部 分 人 员 划 归 6 个 业务 中 心 ， 向 业务 中 心 
负责 人 人 汇报， 剩余 的 极 少数 人 负责 整个 产品 的 研发 项 目 协调 工作 。 基 他 4 个 职能 中 心 的 人 
员 都 按照 业务 线 进行 分 组 ， 分 别 支持 对 应 的 业务 中 心 。 

最 终 ， 每 个 业务 单元 的 人 数 不 同 , 规模 从 十 几 人 到 五 十 几 人 不 等 ,根据 具体 业务 实际 
需要 的 人 员 数 量 划 分 。 

2. 版 本 研发 节奏 

每 个 月 准时 发 布 一 个 高 质量 的 全 网 正式 版 本 。 产品 质量 大 幅度 提高 ,崩溃 率 下 降 90%。 
每 天 发 布 两 个 产品 线 级 的 Beta 版 本 ， 而 每 个 业务 中 心 根据 各 自 需 求 ， 随 时 发 布 本 业务 中 心 
的 试验 版 本 ， 与 产品 级 的 Beta 版 本 不 会 产生 相互 干扰 。 


14.2 改进 方法 论 


对 一 个 产品 团队 的 整体 性 改进 来 说 ,涉及 人 数 与 角色 多 。 如 果 没 有 清晰 的 目标 ， 就 很 
难 让 所 有 人 形成 合力 。 因 此 ， 团 队 上 下 的 目标 一 致 ， 并且“ 让 所 有 人 理解 这 个 目标 ”是 成 
功 关键 。 


14.2.1 指导 思想 


“目标 驱动 ， 从 简单 问题 开始 ， 持 续 改 善 ”是 整个 改进 的 指导 思想 。 

作为 一 个 互联 网 团队 , 用 户 的 真实 反馈 是 最 重要 的 。 然 而 , 从 “版 本 启动 开发 ”到 “ 获 
得 用 户 反 馈 ” 一 般 需要 两 至 三 个 月 。 因 此 ， 团 队 希 望 以 最 快 的 速度 达到 “每 个 月 能 够 保证 
发 布 一 个 高 质量 的 全 网 版 本 ”。 


14.2.2 ”改进 步 又 


由 于 这 是 整个 产品 部 门 的 改进 活动 ,涉及 的 人 数 及 角色 较 多 。 因 此 ， 邀 请 了 有 经 验 的 
外 部 顾问 做 指导 ， 进 行 了 为 期 近 一 年 的 改进 工作 ， 其 改进 步骤 如 下 所 示 。 

(1) 成 立 了 内 部 变革 小 组 。 

(2) 该 产品 线 的 负责 人 亲自 挂帅 ， 成 员 包括 外 部 顾问 及 核心 管理 层 。 

(3) 评估 现状 ， 定 义 目 标 。 

(4) 成 立 变革 小 组 后 ， 在 顾问 的 帮助 下 ， 评 估 团 队 面 临 的 问题 ， 并 定义 了 改进 目标 : 
“激发 个 体 活 力 ， 提 升 产 品 研发 效率 。 达成 目标 的 指标 器 是 “每 个 月 准时 发 布 一 个 高 质量 
的 全 网 版 本 ， 没 有 延期 ”。 
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(5) 识别 具体 问题 ， 制 订 短期 目标 。 

(6) 制订 解决 方案 ， 并 实施 。 

0 施 过 程 中 根据 真实 反馈 ， 不 断 优化 ， 直 到 实现 短期 目标 。 
(8) 返回 第 (3) 步 ， 持 续 进 行 ， 直 到 达成 最 初 设 定 的 目标 。 





14.3 ”改进 的 历程 


整个 改进 的 时 间 跨 度 约 为 一 年 ， 改 进 经 历 了 4 个 阶段 ， 分 别 是 架构 解 耦 、 组 织 解 耦 、 
研发 流程 再 造 和 自动 化 提升 效率 。 


14.3.1 架构 解 耦 


虽然 我 们 定义 了 期 望 达到 的 目标 “每 个 月 保证 发 布 一 个 全 网 版 本 ”， 但 是 当真 开始 动 
手 改进 时 ， 团 队 还 是 有 一 点 茫然 。 到 底 从 哪里 入 手 呢 ?我 们 需要 先 定义 一 个 短期 目标 。 这 
个 目标 应 该 解决 当前 团队 面临 的 最 大 痛 点 ， 并 能 够 给 团队 带 来 信心 。 

技术 研发 部 门 的 负责 人 总 结 了 当时 的 状态 :“ 团 队 一 直 处 于 快速 应 战 状态 。 为 了 能 够 
快速 交付 ， 实 现 功 能 追赶 ， 团 队 规模 快速 扩大 ， 团 队 之 间 的 沟通 下 降 ， 无 法 让 全 员 知 晓 茶 
些 架 构 设 计 的 前 因 后 果 。 团 队 快 速 扩 大 使 新 进入 员 培训 不 是 新 加 入 的 开发 人 员 没 有 时 间 
了 解 整个 系统 架构 和 架构 演变 的 历史 就 立即 编写 代码 # 林 解 产 品 架 构 历史 的 资深 开发 人 员 
不 断 地 修复 新 人 引入 的 缺陷 。 

经 过 讨论 ， 所 有 资深 开发 人 员 都 认为 ,代码 合 入 联 调 和 后 期 的 系统 测试 阶段 是 最 痛苦 
的 。 这 两 个 阶段 的 时 间 长 短 根本 不 可 控 ， 不 确定 性 最 大 。 每 个 版 本 都 不 知道 会 出 现 多 少 缺 
陷 ， 解 决 这 些 缺 陷 需要 多 长 时 间 ， 解 决 这 些 缺 陷 以 后 ， 是 否 会 引发 其 他 缺陷 ? 于是， 团队 
决定 首先 解决 这 个 痛 点 。 

这 个 Windows 客 户 端 系统 是 一 个 典型 的 三 层 系统 架构 , 经 过 多 年 的 快速 开发 , 其 代码 
结构 已 显 凌乱 ， 经 常 出 现 跨 层 调 用 和 多 业务 功能 模块 交叉 调用 的 情况 ,如 图 14-3 所 示 。 产 
品 一 共有 6 个 业务 功能 模块 ， 这 种 交叉 调用 随处 可 见 。 也 正 是 由 于 这 种 交叉 调用 ， 经 常 引 
发 “修改 一 处 代码 ， 其 他 看 似 不 相关 的 功能 模块 出 现 缺 陷 ” 的 问题 。 因 此 ， 团 队 最 首要 
解决 的 问题 应 该 是 通过 架构 解 耦 来 进行 客户 端 系统 架构 的 优化 ， 率 先 解决 累积 的 软件 架 
构 浴 端 。 

从 技术 侧 看 ， 团 队 早已 讨论 过 架构 优化 的 方案 ， 只 是 还 没有 实施 。 于 是 ， 经 过 组 织 变 
革 小 组 的 讨论 ， 最 后 决定 : 将 超过 50% 的 研发 力量 投入 架构 优化 项 目 ， 剩 余 的 研发 力量 用 
于 维护 线 上 的 版 本 ,修改 严重 的 线 上 缺陷 ， 并 且 开 发 一 些 紧 急 且 影响 用 户 体验 的 功能 。 这 
是 一 个 非常 艰难 的 决定 ， 因 为 需要 忍受 至 少 3 个 月 内 没有 重大 特性 的 输出 。 从 这 个 决策 中 
也 可 以 看 出 ， 软 件 架 构 问 题 真 的 已 经 非常 严重 了 。 
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图 14-3 ”意大利 面 式 的 代码 


这 次 软件 架构 调整 的 设计 原则 是 什么 呢 ? 除了 要 遵循 软件 架构 的 基本 原则 , 如 分 层 原 
则 〈《UI 层 、 业 务 逻 辑 层 、 存 储 服务 层 ) 、 高 内 聚 低 耦 合 的 组 件 化 原则 等 ， 我 们 还 特意 强调 
了 “面向 业务 的 插件 化 原则 ”， 即 多 个 业务 之 间 应 该 有 清晰 的 调用 边界 、 对 外 提供 业务 能 
力 的 代码 应 该 放 在 该 业务 自己 所 属 的 模块 内 ， 而 不 是 由 其 调用 方 实现 ， 最 终 形 成 了 客户 端 
的 微 核 架 构 模 式 〈 关 于 微 核 架 构 模 式 ， 参 见 第 5 章 ) ， 如 图 14-4 所 示 。 
插件 A _ 插件 B 插件 F 


























图 14-4 面向 服务 的 微 核 架 构 
经 过 近 3 个 月 的 奋战 ， 这 个 新 架构 版 本 终于 上 线 了 。 后 续 版 本 的 开发 过 程 表 明 ， 团 队 
版 本 效率 得 到 提升 。 在 没有 增加 人 员 以 及 整个 工作 流程 没有 改变 的 情况 下 ， 合 入 时 间 从 3 
天 缩短 到 1 天 ， 而 系统 测试 时 间 从 10 天 缩短 到 5 天 。 这 样 ， 一 个 版 本 从 启动 开发 到 版 本 发 布 
之 间 的 周期 从 29 天 缩短 到 了 22 天 ， 如 图 14-5 所 示 。 由 于 时 间 比 较 紧 张 ， 这 次 架构 解 耦 并 不 
彻底 ， 仍 上 昌 有 部 分 功能 存在 耦合 。 





22 天 
a 0 1 天 .天 5 天 员 
合 入 rn | | 
支线 开发 支线 测试 | 联 箭 | 系统 测试 | 发 





图 14-5 ”架构 解 而 后 的 版 本 开发 周期 
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更 重要 的 是 ， 这 次 客户 端 软件 架构 调整 带 来 了 一 个 更 大 的 收益 ， 那 就 是 整个 团队 可 以 
分 为 双 版 本 交替 并 行 开 发 ， 即 每 3 个 开发 组 所 负责 的 特性 集 作为 一 个 版 本 进行 发 布 ， 两 个 
版 本 可 以 交错 运行 ， 如 图 14-6 所 示 。 


团队 分 支 4 
团队 分 支 5 


团队 分 支 6 












图 14-6 ”架构 解 看 后 的 双 线 版 本 分 支 发 布 策 略 











从 用 户 视 角 上 ， 两 个 版 本 间 的 发 布 时 间 缩 短 了 ， 每 个 版 本 都 有 一 些 新 特性 ,提高 了 用 
户 的 产品 感知 度 。 
14.3.2 组织 解 耦 
品 线 管理 者 认为 效率 虽 有 提升 , 但 仍旧 未 达到 满意 结果 。 各 职能 部 门 之 间 仍 存在 信 
息 沟 通 不 顺 ， 尤 其 是 当 生 产 环境 上 出 现 问 题 ， 在 修改 后 对 其 进行 复 盘 时 ， 抱 怨 较 多 ， 你 会 
听 到 每 个 角色 都 有 非常 充分 的 理由 ， 例 如 : 
e 运 维 人 员 说 ;“ 上 线 没 有 提前 通知 ， 时 间 很 紧 ， 也 没有 上 线 说 明文 档 ……” 
e 项 目 经 理 说 ;“ 这 个 问题 是 测试 漏 测 导 致 的 ……” 
e 测试 人 员 说 :“ 拿 到 测试 包 太 晚 了 ,测试 时 间 被 压缩 太 多 了 …… 男 外 ， 开 发 质量 大 
差 ，bug 太 多 。 
e 开发 人 员 说 :“ 没 办 法 ， 产 品 需 求 变更 太 多 了 ， 重 复 开 发 工作 特别 多 ……” 
e 产品 人 员 说 :“ 需 求 早 就 提 了 ， 设 计 人 力 不 足 ， 设 计 稿 出 得 太 晚 了 ……” 
e 设计 人 员 说 :“ 产 品 需求 没有 梳理 清楚 ， 与 之 前 的 功能 设计 有 冲突 ， 开 发 的 程序 与 
设计 稿 有 出 入 ……” 
而 每 次 提出 的 改进 措施 也 总 是 “老生 常 谈 "， 总 是 带 着 “防御 性 协作 ”的 味道 ， 例 如 : 
e 开发 人 员 说 :“ 能 不 能 提前 想 清 楚 一 些 ， 不 出 定稿 不 要 让 我 们 开发 ? ”或 者 “需求 
评审 已 经 通过 ， 需 求 冻结 了 ， 不 能 改 1” 
e 测试 人 员 说 :“P0 用 例 测 试 不 通过 ， 不 许 提 测 ”或 者 “进入 系统 测试 阶段 以 后 ， 需 
求 就 不 许 再 改 啦 1” 
。 运 维 人 员 说 ;“ 下 次 上 线 操 作 能 不 能 提前 通知 一 下 ”或 者 “上 线 步 又 必须 经 过 我 们 
评审 ， 按 照 运 维 标准 填写 ， 不 能 出 现 漏 填 现 象 。” 
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e 项 目 经 理 说 :“ 需 求 变更 要 严格 控制 ， 否 则 项 目 进度 无 法 把 控 。 

为 了 避免 出 错 ， 在 大 型 产品 团队 中 ,往往 通过 严格 的 流程 来 控制 风险 。 在 各 个 职能 部 门 
之 间 ， 这 种 流程 常常 会 形成 一 种 上 下 游 交 付 时 的 自我 保护 。 例 如 ， 即 便 开 发 人 员 保证 “只 改 
动 了 一 小 点 儿 ”, 测试 人 员 也 要 做 一 轮 完整 的 回归 , 因为 测试 部 门 对 最 终 发 布 出 去 的 软件 质量 
负责 ， 而 测试 团队 的 过 去 经 验 表明 “开发 人 员 的 话 是 不 可 信 的 ”。 但 是 ， 管 理 者 心里 却 在 想 : 
“这 几 百 人 每 天 都 在 忙 什 么 呢 ? 很 早 之 前 讨论 过 的 功能 特性 ， 为 什么 现在 还 没有 发 布 呢 ?1” 

正如 本 文 前 面 所 描述 的 那样 ， 整 个 部 门 以 工作 职能 划分 成 不 同 的 职能 部 门 ， 希 望 各 职 
能 部 门 各 司 其 职 ， 齐 心 协力 ， 共 同 完成 整个 事业 部 的 共同 业务 目标 。 这 种 职能 划分 方式 在 
团队 人 数 不 多 时 ， 是 一 种 较 好 的 组 织 结 构 ， 比 较 容易 集中 精力 ， 高 效 完成 已 知 任务 。 然 而 ， 
当 团队 人 数 较 多 , 或 者 目标 实现 途径 不 是 非常 明确 时 , 这 种 组 织 结构 可 能 会 导致 效率 低下 。 

虽然 每 个 人 都 知道 产品 线 的 总 目标 , 但 是 , 每 个 职能 部 门 都 无 法 对 这 个 总 目标 完全 负 
责 。 各 部 门 会 不 自觉 地 更 看 重 自己 的 工作 目标 和 做 事 立 场 。 每 个 版 本 都 需要 统一 协调 这 几 
大 部 门 之 间 的 资源 ， 这 就 需要 大 量 的 沟通 协调 工作 。 

如 何 激发 团队 成 员 打 破 各 职能 部 门 之 间 的 壁垒 呢 ? 如 何 促进 各 职能 部 门 能 够 以 整体 
利益 为 重 ? 如 何 让 协作 流程 不 仅仅 是 看 起 来 美好 , 而 且 在 实际 操作 时 真正 促进 各 部 门 目标 
一 致 呢 ? 

经 过 变革 领导 小 组 的 讨论 ,最 终 决定 改变 组 织 结构 。 将 这 种 依据 职能 划分 组 织 架 构 的 
方式 转变 为 依据 业务 领域 划分 的 组 织 结构 ， 即 “业务 FT 化 ”。 这 个 想法 源 自 敏捷 软件 开发 
方法 所 倡导 的 “特性 团队 ”(feature team)。 有 所 不 同 的 是 ， 每 个 小 团队 不 仅仅 是 多 角色 负 
责 端 到 端 地 交付 一 些 软件 功能 ， 而 且 要 负责 达成 明确 的 业务 目标 。 事 实 上 ， 每 个 小 团队 都 
是 一 个 迷你 业务 单元 (mini-business unit) ， 独 自负 责 某 个 范围 的 子 业 务 ， 即 职能 相对 完备 
的 一 个 小 组 ， 对 该 业务 领域 的 业务 目标 和 业绩 结果 负责 。 

对 这 种 以 业务 为 导向 的 全 功能 团队 来 说 , 其 目标 不 再 是 敏捷 软件 开发 中 所 提 的 “快速 
交付 一 组 功能 ”"， 而 是 负责 面向 业务 价值 的 交付 ， 即 “以 业务 目标 为 导向 的 子 业务 团队 ”， 
确保 整个 部 门 业务 战略 目标 的 落地 实现 。 

我 们 以 子 功能 模块 为 一 个 迷你 业务 单元 , 每 个 单元 指定 一 个 业务 负责 人 ， 由 其 带领 一 
个 多 角色 全 功能 团队 。 该 团队 有 自己 的 业务 目标 ， 这 个 业务 目标 类 似 于 “在 接 下 来 的 6 个 
月 内 ,让 本 团队 负责 的 业务 能 力 表现 超越 其 他 竞争 对 手 ， 并 且 让 使 用 该 业务 功能 的 新 增 月 
平均 日 活跃 用 户 增加 40%”。 

此 时 的 组 织 框架 就 显现 了 改进 后 的 团队 状态 一 一 以 业务 导向 的 全 功能 团队 (6 个 业务 
中 心 和 5 个 支撑 子 部 门 )。 整 个 产品 线 的 人 员 座 位 进行 了 重新 调整 ， 将 原来 按 职能 中 心 划分 
的 座位 区 域 改 成 按 业务 中 心 划 分 座位 区 域 。 同 时 ， 对 支撑 部 门人 员 (如 在 测试 中 心 的 测试 
人 员 ) 来 说 ， 若 其 参与 对 应 业务 中 心 的 工作 ， 则 与 该 业务 中 心 人 员 的 工 位 在 一 起 ， 承 担 相 
应 的 工作 ， 同 时 也 对 该 业务 的 目标 负责 。 
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在 这 次 调整 中 , 一 个 比较 大 的 挑战 是 业务 中 心 负责 人 的 选拔 与 任命 。 因 为 每 个 业务 中 
心 负责 人 都 可 以 看 作 是 一 名 “业务 负责 人 ”， 而 不 再 是 产品 负责 人 ， 或 者 是 研发 负责 人 
他 (她 ) 需要 深入 了 解 整个 产品 线 的 年 度 战 略 ， 同 时 制订 本 业务 中 心 的 战略 落地 方案 ， 过 
成 自己 所 负责 的 团队 业务 目标 ， 而 不 只 是 产品 功能 设计 或 者 实现 。 

通过 这 样 的 组 织 改造 , 每 个 业务 中 心 都 有 了 自己 非常 明确 要 为 之 奋斗 的 业务 目标 , 整 

个 部 门 的 工作 氛围 也 发 生 了 很 大 的 变化 。 当 你 走 到 业务 团队 工作 区 时 ， 时 常会 听 到 类 似 下 
而 这样 的 对 话 。 

e 开发 人 员 说 :“ 这 个 按钮 放 在 右边 , 是 不 是 会 更 好 一 点 。 这 个 用 户 体验 好 像 不 够 好 ， 

你 再 设计 一 下 ， 我 晚上 加 一 会 儿 班 ， 再 改 改 。 

e 测试 人 员 对 开发 人 员 说 :“ 我 可 以 帮 你 多 触发 儿 种 场景 来 验证 一 个 这 个 功能 。 

。 产品 经 理 对 开发 人 员 说 :“ 你 修改 好 以 后 ， 马 上 告诉 我 ， 让 我 先 来 体验 一 

e 测试 人 员 对 开发 人 员 说 :“ 现 在 有 新 版 本 可 以 验证 了 吗 ? ” 

e 项 目 经 理 对 团队 说 :“ 大 家 都 好 好 验证 一 下 …… 马 上 就 要 合 入 主 版 本 啦 ……” 

这 种 变化 令 所 有 业务 团队 的 积极 性 和 主动 性 空前 高 张 ， 业务 中 心 的 内 部 闭环 明显 , 沟 
通 效 率 得 到 了 提升 。 在 支线 研发 阶段 中 , 原来 的 开发 阶段 与 测试 阶段 之 间 的 明显 界限 消失 ， 
该 阶段 的 时 间 周 期 从 15 天 缩短 到 了 10 天 ， 但 产 出 并 没有 减少 ;如 图 14-7 所 示 。 

















支线 开发 + 测试 系统 测试 E 


图 14-7 FT 化 后 的 版 本 开发 周期 








“业务 FT 化 ”有 效 地 提升 了 效率 ， 解 决 了 职能 部 门 为 了 各 部 门 利益 解决 问题 的 状况 。 
但 是 ,经 历 了 两 个 新 版 本 发 布 以 后 ， 各 业务 中 心 之 间 又 出 现 了 一 些 以 前 没有 听 到 过 的 呼声 : 
“我 们 中 心 早 都 开发 完了 ， 还 要 等 其 他 两 个 中 心 开 发 完成 ， 才 能 合 入 代码。 他 们 太 慢 了 , 耽 
误 时 间 啊 !” 0 下 需求 , 不 想 再 等 大 版 本 的 排 期 了 。 

出 现 这 种 声音 是 意料 之 中 的 事情 。 经 过 组 织 架 构 的 调整 以 后 ， 每 个 业务 中 心 的 团队 士 
气 和 积极 性 被 调动 起 来 了 。 每 个 业务 中 心 都 有 自己 的 业务 目标 , 各 角色 通力 合作 是 第 一 要 务 。 

然而 ， 整 个 产品 的 研发 流程 并 没有 发 生变 化 ， 仍 旧 是 双 线 并 行 的 运作 模式 (图 14-6)， 
这 使 得 至 少 3 个 业务 中 心 只 能 共同 进退 ， 共 同 开发 一 个 大 版 本 。 各 业务 中 心 希望 自己 能 
更 大 的 自由 度 ， 不 想 被 其 他 中 心 的 研发 进度 所 束缚 。 


14.3.3 ”研发 流程 再 造 
是 否 马 上 就 减少 对 业务 中 心 的 束缚 , 让 各 业务 中 心 自 由 发 版 呢 ? 项 目 管理 组 进行 了 讨 
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论 ， 列 出 如 下 一 系列 待 解决 的 问题 。 
(1) 各 业务 中 心 什么 情况 下 才能 外 发 版 本 ? 外 发 版 本 的 质量 要 求 是 什么 ?如 何 保障 


(2) 整个 产品 线 的 统一 版 本 与 各 业务 中 心 的 自发 版 本 之 间 的 关系 是 什么 样 的 ?各 中 心 
的 版 本 如 何 归并 ? 应 该 在 什么 时 机 归并 到 统一 版 本 ? 

(3) 小 版 本 太 多 ,会 不 会 伤害 用 户 体验 ?如 何 做 到 既 不 伤害 用 户 体验 ， 又 能 尽早 收 到 
反馈 ? 

(4) 谁 有 权 审 批 外 发 版 本 ? 外 发 版 本 的 策略 是 什么 ? 

(5) 一 个 业务 中 心 的 外 发 版 本 中 ， 是 否 带 其 他 业务 中 心 的 功能 ?” 带 哪些 功能 ? 

(6) 假如 A 业务 中 心 刚刚 对 外 发 布 版 本 A1l1, 现在 B 业 务 中 心 也 完成 了 一 个 新 的 版 本 B1， 
这 时 候 B1 版 本 要 马上 与 Al 版 本 合并 外 发 吗 ? 

(7) 如 果 版 本 Al 出 现 了 严重 问题 , 要 回 滚 版 本 , 那么 后 续 的 版 本 B1, 甚至 C1 如 何 处 理 ? 

(8) 多 个 中 心 在 同一 时 间 点 都 想 发 新 版 本 ， 是 否 需要 合成 一 个 版 本 再 外 发 ? 

(9) 这 个 新 版 本 发 出 后 , 如 果 发 现 该 版 本 中 某 个 中 心 的 代码 有 严重 质量 问题 , 怎么 办 ? 

要 想 让 每 个 业务 中 心 都 能 够 根据 自己 的 研发 节奏 运作 ， 并 且 不 影响 其 他 的 业务 中 心 ， 
还 能 够 保障 整个 产品 的 研发 版 本 运行 顺畅 ， 必 须 解 决 上 述 问题 。 

1. 多 版 本 发 布 的 目的 与 原则 

一 定 要 先 找 出 其 中 最 关键 的 问题 来 解决 。 可 是 哪 一 个 问题 是 最 关键 的 呢 ? 经 过 深入 的 
讨论 ,发现 最 关键 的 问题 并 不 在 上 面 的 问题 列表 中 。 这 些 都 是 围绕 “如 何 解 决 外 发 版 本 中 
存在 的 问题 ”， 而 外 发 版 本 中 最 关键 的 问题 是 : 快速 外 发 版 本 的 目的 和 原则 是 什么 ? 只 有 
回答 了 这 个 问题 ， 才 能 以 此 为 基础 ， 讨 论 前 面 那 一 堆 问 题 的 解法 。 

目标 当然 是 为 了 快速 验证 。 验 证 有 两 个 方面 。 

(1) 代码 质量 。 由 于 是 互联 网 产品 ， 面 向 海量 的 用 户 ， 而 其 产品 形式 是 Windows 客 户 
端 ， 不 是 在 服务 器 端 部 署 。 因 此 可 以 认为 ， 每 个 客户 端 所 运行 的 环境 都 千差万别 ， 包 括 操 
作 系 统 版 本 、 补 丁 包 、 所 安装 的 其 他 软件 等 。 可 以 通过 少量 外 发 ， 在 影响 最 小 的 情况 下 ， 
尽早 地 发 现代 码 质量 问题 。 

(2) 业务 表现 。 这 种 互联 网 产品 ， 无 法 直接 向 用 户 提问 :“ 你 的 需求 到 底 是 什么 ? ” 
因为 用 户 太 多 ， 需 求 太 多 ， 无 法 穷 举 。 因 此 ， 产 品 经 理 需 要 根据 用 户 使 用 产品 的 真实 反馈 
对 产品 进行 改进 ,改进 后 还 需要 尽早 验证 这 些 改动 是 否 满足 了 用 户 的 需求 。 而 尽早 验证 的 
最 好 方式 就 是 让 用 户 早 一 点 儿 使 用 这 些 新 特性 ， 并 获得 尽早 的 体验 反馈 〈 问 题 上 报 、 体 验 
反馈 ， 以 及 功能 数据 采集 ) 。 

发 版 原则 有 两 个 。 

(1) 不 能 让 用 户 感觉 到 骚扰 。 如 果 某 个 用 户 因为 使 用 我 们 的 产品 ， 频 繁 被 产品 的 升 
级 提醒 所 骚扰 ， 则 是 对 用 户 的 一 种 伤害 。 如 何不 让 用 户 有 这 种 烦恼 呢 ? 我 们 的 原则 是 : 
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尽 可 能 让 每 个 用 户 在 一 定 的 时 间 周 期 内 接收 多 于 一 次 的 升级 提醒 ， 并 确定 这 个 时 间 为 一 
个 月 。 

(2) 外 发 版 本 的 质量 要 达标 ， 不 能 让 尝鲜 的 用 户 感受 到 不 愉快 的 体验 。 必 须 定 义 质量 
标准 ， 一 是 Beta 版 本 外 发 标准 ， 二 是 版 本 撤回 标准 。 所 谓 Beta 外 发 标准 ， 就 是 指 判定 某 一 
版 本 质量 是 否 达到 可 以 外 发 的 质量 标准 。 版 本 撤回 标准 是 指 已 经 外 发 后 的 版 本 ， 其 质量 反 
馈 达 到 什么 样 的 水 平 ， 就 应 该 被 定义 为 “质量 低劣 ， 必 须 回收 ”"。 要 想 明 确 回答 这 个 问题 
并 不 是 件 很 容易 的 事 ， 既 需要 有 历史 数据 支持 ， 也 要 收集 很 多 新 的 数据 。 

现在 大 家 对 原则 达成 了 一 致 ， 接 下 来 就 到 实施 方案 的 设计 阶段 了 。 

2. 虚拟 主干 的 混合 分 支 模式 

团队 希望 在 较 短 时 间 内 就 能 做 到 产品 线 的 多 版 本 高 频 发 布 。 首 先 想 到 的 方案 是 “主干 
开发 ， 分 支 发 布 ”模式 。 因 为 要 想 加 快 发 布 频率 ， 原 来 使 用 的 长 周期 分 支 方式 是 影响 效率 
的 ， 频 率 越 高 ， 越 应 该 使 用 主干 开发 的 模式 ， 如 图 14-8 所 示 ， 正 像 PaulHammant 在 2013 年 
发 表 的 一 篇 关于 Facebook 主 干 开发 模式 的 论文 中 指出 的 那样 。 然 而 ， 团 队 只 有 少量 端 到 端 
的 自动 化 回归 测试 用 例 ， 而 且 不 能 非常 稳定 地 运行 ,无 法 发 挥 测试 保护 网 的 作用 。 在 短 时 
间 内 建立 一 个 自动 化 测试 保护 网 是 不 现实 的 。 另 外 ,在 短 时 间 内 让 所 有 开发 人 员 和 测试 人 
员 改 变 工 作 习 惯 ， 同 时 要 应 对 业务 交付 压力 ， 挑 战 实 在 太 厌 了， 很 难 在 短 时 间 内 完成 。 因 
此 ， 数 十 人 在 同一 主干 上 开发 ， 根 本 无 法 保障 主干 代码 的 质量 。 
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图 14-8 发 布 频率 与 分 支 模式 的 关联 
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既然 此 路 不 通 ， 我们 决定 不 对 原 有 的 研发 模式 做 出 太 大 的 改变 ， 只 做 出 一 些 改进 。 原 
有 的 研发 分 支 模式 是 团队 分 支 模式 ， 即 每 个 FT 独占 一 个 开发 分 支 ， 详 见 第 8 童 。 这 种 分 文 
方式 的 代码 合 人 验证 成 本 高 ， 集 成 频率 低 ， 质 量 风险 不 可 控 。 假 如 能 够 做 到 “不 需要 分 支 
合并 ， 就 解决 这 个 问题 了 吧 ? 于 是 ， 我 们 决定 直接 将 产品 线 的 代码 库 按 业务 进行 拆 分 。 
这 样 一 来 , 每 个 业务 中 心 拥 有 各 自 独 立 的 代码 库 , 且 不 修改 其 他 业务 团队 代码 库 中 的 代码 ， 
如 图 14-9 所 示 。 
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图 14-9 ”以 版 本 配置 表 为 中 心 的 多 代码 仓库 开发 模式 





那么 ， 代 码 分 库 以 后 ，6 个 团队 如 何 合作 呢 ? 

假设 该 产品 线 刚 刚 发 布 了 一 个 质量 达标 的 版 本 ， 即 图 14-9 中 的 版 本 Release 1， 这 个 版 
本 的 源 代 码 对 应 各 业务 中 心 代码 仓库 的 不 同 标签 (TagA_1,TagB_1,…,TagF_1)。 这 6 个 标签 
共同 组 成 了 一 个 配置 元 组 ， 被 称 为 一 个 版 本 配置 表 ， 即 最 新 质量 达标 版 本 标签 
(last good version tag) 。 

当 团 队 A 完 成 一 组 新 功能 , 希望 对 外 发 布 版 本 时 ， 只 要 将 其 对 应 的 版 本 标签 TagA_2 与 
其 他 几 个 团队 的 last_good_vesion_ tag 组 合 在 一 起 ， 形 成 一 个 新 的 版 本 发 布 配 置 表 ， 根 据 这 
个 配置 表 对 代码 进行 编译 打包 ， 验 证 通过 后 ， 即 可 发 布 。 此 时 ,将 A 团队 的 
last_good_version_tag 变 更 为 TagA_ 2, 并 将 这 个 新 的 版 本 发 布 配置 元 组 作为 下 一 次 版 本 发 布 
的 基线 。 当 其 他 团队 需要 发 布 新 功能 时 ， 也 同样 操作 即 可 。 

这 样 的 设计 使 得 在 产品 线 这 一 级 别 上 , 不 再 存在 真正 的 代码 仓库 ,取而代之 的 是 一 个 
由 一 系列 版 本 配置 表 组 成 的 虚拟 主干 ,每 个 版 本 标签 配置 元 组 就 是 该 虚拟 主干 上 的 一 个 版 
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本 标签 (Tag)。 

可 是 ,现实 并 非 如 此 理想 。 有 一 些 代码 或 文件 无 法 直接 划分 到 某 一 个 业务 代码 库 中 ， 
因为 它们 可 能 被 每 个 团队 使 用 或 修改 。 进 一 步 分 析 后 发 现 ， 可 以 分 成 两 种 情况 。 

(1) 一 些 文件 是 公共 文件 ， 并 不 属于 业务 功能 模块 。 例 如 ， 那 些 用 于 生成 该 产品 的 应 
用 程序 安装 文件 的 代码 。 

(2) 一 些 文件 由 每 个 中 心 维护 其 中 部 分 内 容 。 例 如 ， 某 个 文件 的 内 容 是 一 系列 的 文件 
名 和 对 应 的 文件 路 径 ， 而 其 中 的 文件 名 和 路 径 需要 各 业务 中 心 提供 并 维护 。 打 包 程 序 会 使 
用 这 个 文件 中 的 文件 列表 ， 进 行 相关 的 操作 。 

对 于 第 一 种 情况 , 我 们 决定 单独 建立 一 个 代码 库 , 存放 这 些 公共 且 不 经 常 改变 的 代码 。 
对 于 第 二 种 情况 (如 前 面 提 到 的 保存 文件 名 及 路 径 列表 的 那个 文件 )， 我 们 将 其 按照 中 心 
分 割 成 多 个 文件 片段 ， 由 每 个 中 心 放 在 各 自负 责 的 代码 库 中 ， 自 行 维护 属于 自己 的 文件 片 
段 。 当 需要 这 个 文件 列表 时 ， 由 工具 将 多 个 文件 片段 再 拼接 在 一 起 。 











于 是 ， 我 们 的 代码 分 支 结构 就 变 成 了 如 图 14-10 所 示 的 样子 。 
Release_ 1 Release 2 
rTagO 11 "TagO 2 
有 ITagA_1， rTEEA_21 
产品 线 级 !T Ri 1 1 ! 
版 本 配置 表 Te- | | Ce 
ITagF_1 ! /TagE 1 
TV 汀 全 汪 


| H 
人 TagO 1 update 、TagE 2 


-| 
[| J LA 
1 | 于 | 

















1 队 是 > 
0 ~ TagF | 


图 14-10” 带 有 公共 代码 库 分 支 的 混合 分 支 发 布 策略 
图 14-10 中 ， 当 A 团 队 需要 修改 公共 库 的 程序 时 ， 要 从 公共 代码 库 拉 取 分 支 ， 与 其 自己 
的 代码 库 一 起 ， 作 为 其 工作 中 可 修改 的 代码 。 当 团队 A 当前 的 版 本 质量 验证 通过 后 ， 即 可 
将 公共 库 分 支 上 的 代码 变更 合 入 公共 库 的 主干 上 ,并 打上 标签 TagO_2。 这样， 最 新 的 产品 
版 本 配置 表 就 由 下 面 的 标签 集合 组 成 {TagO_2, TagA_2, TagB_1, …, TagF_1}。 

3. 建立 统一 制品 库 

我 们 还 有 一 些 具体 的 细节 问题 需要 解决 。 当 把 代码 仓库 分 开 以 后 , 给 开发 人 员 带 来 的 
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一 个 基本 问题 是 : 如 何在 本 地 调试 自己 开发 的 新 功能 。 因 为 每 个 开发 人 员 都 需要 其 他 5 个 
团队 的 代码 ， 应 用 程序 才能 启动 运行 。 因 为 不 提供 其 他 5 个 团队 的 源 代码 ， 所 以 每 个 团队 
必须 为 其 他 团队 的 工程 师 提 供 自己 构建 出 来 的 质量 合格 的 二 进 制 组 件 。 
为 了 解决 这 一 问题 ， 我 们 需要 对 原 有 产品 的 解决 方案 文件 ( 即 Visual Studio 项 目的 
solution 文 件 ) 进行 拆 分 ， 以 便 可 以 独立 生成 各 自 的 组 件 制 品 。 拆 分 原则 如 下 : 
。 每 个 团队 有 自己 代码 库 的 工程 构建 文件 ; 
e 每 个 团队 自己 的 代码 应 该 可 链接 生成 二 进 制 库 文 件 ; 
e 将 对 其 他 团队 的 代码 依赖 修改 为 对 二 进 制 库 文件 的 依赖 ， 
。 让 每 个 开发 人 员 都 能 很 方便 地 获取 其 所 需要 的 其 他 团队 质量 合格 的 二 进 制 库 文件 ， 
。 产品 仓库 中 的 每 个 库 文件 都 应 该 可 追 湖 ， 即 根据 库 文 件 的 信息 ， 能 很 方便 地 找到 
对 应 的 源 代 码 、 对 应 版 本 以 及 作者 ; 
e 对 外 提供 相应 功能 服务 的 业务 模块 拥有 相应 代码 ， 调 用 方 仅 可 使 用 其 对 外 开放 的 
接口 。 
根据 上 述 原则 ， 我 们 整理 了 需要 完成 的 任务 : 
。 将 现 有 的 工程 构建 文件 重新 规划 、 分 割 整理 ， 为 每 个 业务 模块 建立 相应 的 工程 
文件 ， 
。 提供 一 种 方式 ， 将 各 业务 模块 编译 生成 且 验 证 通过 的 二 进 制 库 文件 自动 放 入 统一 
的 二 进 制 文件 制品 库 ， 做 到 统一 管理 ; 
e 提供 一 种 工具 ， 使 开发 者 可 以 一 键 式 从 统一 的 产物 仓库 中 获取 其 所 需 的 所 有 二 进 
制 库 文件 ， 以 方便 开发 过 程 中 的 调试 。 
在 讨论 过 程 中 , 我 们 还 发 现 了 一 个 遗留 的 软件 配置 管理 问题 。 他 们 在 SVN 中 保存 生产 
过 程 中 产 出 的 PDB 文 件 ， 这 严重 违反 了 我 们 在 第 11 章 中 讲 到 的 源 代码 管理 原则 。 因 此 ， 也 
一 并 将 其 从 源 代码 仓库 中 拆 分 出 来 ， 放 入 统一 制品 库 保存 。 


























为 什么 团队 会 把 二 进 制 文件 放 到 SVN 中 

深入 讨论 细节 后 ， 才 发 现 他 们 的 动机 非常 简单 一 一 “ 懒 *。 该 产品 用 到 了 很 多 的 第 
三 方 库 文件 。 为 了 方便 找到 这 些 库 文件 ， 团 队 会 把 它们 直接 提交 到 代码 仓库 中 。 另 外 ， 
每 次 发 布 前 构建 正式 发 布 包 时 ， 会 同时 生成 PDB 文件 ， 这 个 三 进 制 文件 很 大 ， 但 也 被 提 
交 到 代码 仓库 中 了 。 这 样 ， 当 某 个 用 户 遇 到 问题 后 ， 上 报 缺 陷 给 团队 ， 开 发 人 员 可 以 从 
代码 仓库 找到 对 应 版 本 的 PDB 文件 ， 用 于 定位 问题 。 

这 种 做 法 会 产生 以 下 两 个 问题 。 

(1 ) 开发 人 员 拉 取代 码 时 ， 经 常 导致 拉 取 失败 。 

(2 ) 源 代码 仓库 过 大 ， 存 储 空间 膨胀 过 快 。 
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4. 两 级 发 布 体系 

我 们 希望 每 个 业务 中 心 都 可 以 发 布 自己 中 心 的 软件 版 本 ， 以 便 尽早 验证 其 软件 质量 ， 
并 收集 新 功能 的 效果 数据 。 只 有 当 质 量 达 标 且 功能 特性 效果 也 不 错 的 情况 下 ,才能 将 其 功 
能 放 入 全 网 版 本 ,进行 全 网 推广 。 因 此 ， 我们 设计 了 两 级 发 布 体系 。 一 个 级 别 是 业务 中 心 
级 ， 指 每 个 中 心 可 以 对 外 发 布 试验 版 本 ， 每 个 中 心 会 有 一 份 本 中 心 的 版 本 配置 表 。 另 一 个 
级 别 是 产品 线 级 ， 指 真正 有 可 能 推广 的 统一 版 本 ， 它 只 有 一 份 统一 的 产品 级 ， 如 图 14-11 
所 示 。 





Release 1 Release 2 

cr-----  ---- 一 

要 1TagO_1 TagO 2! 

产品 线 级 ITagA_11 1TagA-2 | 

版 本 配置 表 1TagB_1 ， ITagB_1 1 
1 


ITagF_1 1 ITagF_ 11 
A 





和 


PC 一 -六 -= 


> | !TagO_11 Tag© A 21 
、、 A 中 心 ITagA_11 IagA 2 1 
See 版 本 配置 表 | !TagB_1， 1TagB_1 

国 1 i | 

加 ITagF 1 | 1TagF 1 1 


\、 乒 一 |TagF_1 
0 
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图 14-11 两 级 版 本 发 布 示意 图 


A 团队 修改 代码 ， 添 加 了 新 特性 以 后 ， 首 先 要 进行 业务 中 心 级 发 布 ， 即 使 用 图 14-11 
中 的 Release A_2 这 个 业务 中 心 级 的 版 本 配置 表 进 行 构建 验证 ,并 对 外 进行 业务 中 心 级 的 灰 
度 发 布 。 如 果 质 量 及 功能 等 各 方面 都 达标 ， 就 可 以 将 属于 A 团 队 的 公共 库 分 支 代码 合 和 人 公 
共 库 主干 上 , 产生 标签 TagO_2。 之 后 , 就 可 以 使 用 Release_ 2 这 个 产品 线 级 版 本 配置 表 进 行 
构建 验证 ， 再 对 外 进行 产品 级 的 版 本 发 布 。 

一 且 产 品 线 级 发 布 成 功 , 持续 交付 平台 就 自动 将 更 新 公共 库 标 签 TagO_2 的 代码 下 推 到 
其 他 团队 的 公共 库 分 支 上 , 通知 各 业务 中 心 , 并 更 新 业务 级 版 本 配置 表 的 Last_good_version 
的 内 容 ， 与 产品 线 级 版 本 配置 表 保 持 一 致 ， 这 就 意味 着 ， 所 有 业务 中 心 在 进行 下 一 次 发 布 
(无 论 是 中 心 级 还 是 产品 线 级 ) 时 ， 都 要 使 用 这 个 最 新 版 本 代码 基线 。 

当 产 品 线 级 发 布 中 某 个 新 版 本 出 现 质量 问题 , 需要 进行 回 滚 代 码 时 ， 只 要 将 版 本 配置 
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表 中 的 信息 使 用 上 一 个 版 本 的 版 本 配置 信息 重 置 一 下 ， 并 通知 所 有 业务 中 心 即 可 。 至 此 ， 
整个 产品 线 的 开发 工作 流程 如 图 14-12 所 示 。 


1. 同步 主线 Last_good 版 本 















































1 业务 中 心 级 更 新 业务 中 心 级 的 配置 表 

! 4 更 新 产品 产品 线 级 配置 表 5. 主线 测试 ， 发 布 监控 

| i |】 版 本 配置 表 | [SR ~ EE FE 

1 生 务 中 心 A 口 是 | 中 心 A| SVN: URLIBrevision 》 构建 》 人 》 a 监控 
日 国生 s 
1 1 1 Yes 

人 EC < 和 屿 > 
;业务 中 心 口 鹿 E ， 。 同 深 版 本 配置 表 < 和 > 


EES pe ee ep Rr ee 


2. 各 中 心 必 
开发 测试 ' - 
'、 人 筑 各 中 心 取 用 


3. 中 心 级 灰 度 发 布 
图 14-12 ”两 级 版 本 配置 表 的 更 新 流程 














5. 版 本 质量 管理 机 制 

PC 客户 端 互 联网 产品 的 质量 管理 挑战 在 于 应 用 版 本 的 分 发 、 回 收 , 以 及 运行 环境 的 不 
受 控 。 不 同 的 用 户 会 从 不 同 渠道 获得 各 种 各 样 的 产品 版 本 。 操 作 系 统 也 会 不 断 打 补丁 或 升 
级 ,尤其 是 Windows 平 台 ， 儿 平 每 周 都 会 有 补丁 包 。 另 外 ,为 了 提供 更 好 的 用 户 使 用 体验 ， 
几乎 所 有 的 产品 团队 都 会 避免 强制 用 户 升级 。 为 了 确保 对 外 发 布 的 版 本 质量 ， 我 们 在 业务 
中 心 级 和 产品 线 级 的 两 级 发 布 中 都 建立 了 灰 度 发 布 机 制 。 

当前 设计 的 这 种 多 团队 混合 分 支 、 多 个 小 版 本 发 布 方式 与 改进 前 的 统一 大 版 本 运作 模 
式 相 比 ， 带 来 一 个 明显 的 差异 就 是 外 发 版 本 数量 的 增加 。 假 如 没有 良好 的 机 制 来 控制 每 个 
小 版 本 的 外 发 、 质 量 监控 和 收回 ， 以 及 质量 达标 后 向 主 版 本 归并 的 策略 ， 那 么 就 会 出 现 版 
本 混乱 甚至 失控 的 状况 。 

因此 , 我 们 对 每 个 团队 的 支线 外 发 版 本 和 主线 外 发 版 本 都 制订 了 质量 标准 并 进行 相应 
的 监控 。 不 同 的 灰 度 级 别 对 应 不 同 的 质量 标准 。 例 如 ， 对 支线 外 发 版 本 ， 分 成 4 个 灰 度 级 
别 ， 分 别 是 1x、5x、10x 和 20x， 用 于 验证 该 业务 中 心 新 版 本 的 质量 稳定 性 。 主 线 外 发 版 本 
则 包括 1y、2y、10y、50y、100y 和 200y 等 在 内 的 8 个 级 别 。 每 个 级 别 都 有 基础 稳定 性 质量 
指标 ， 其 中 一 个 基础 质量 指标 是 软件 崩溃 率 。 在 每 天 的 软件 月 涡 率 统计 中 ， 如 果 某 个 业务 
中 心 的 指标 未 达标 ， 则 该 团队 不 准许 合 入 新 功能 ， 必 须 立 即 开 始 着 手 修复 问题 。 只 有 达到 
质量 标准 后 ， 才 允许 该 业务 中 心 发 布 新 功能 。 

这 样 的 机 制 使 得 业务 中 心 负责 人 既 要 关注 业务 指标 , 也 必须 关注 软件 基础 质量 。 如 果 
软件 基础 质量 不 达标 ， 即 便 开发 了 新 的 业务 特性 ， 也 无 法 及 时 发 布 。 

6. 多 业务 协同 发 布 机 制 

这 种 研发 流程 可 以 支持 多 个 业务 中 心 并 行 工作 , 支持 业务 中 心 级 的 随时 版 本 发 布 。 那 
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么 ， 如 何 组 织 产品 线 级 的 版 本 发 布 频率 呢 ? 我 们 尝试 了 很 多 种 管理 机 制 ， 来 协调 多 业务 中 
心 的 统一 发 布 ， 最 终 证 明 ， 有 效 运行 机 制 并 不 是 计划 经 济 (统一 指定 发 布 时 间 )， 而 是 自 
由 经 济 (每 个 中 心 的 代码 只 要 质量 达标 ， 就 可 以 进行 产品 线 级 的 发 布 )。 

产品 线 级 的 版 本 发 布设 有 一 个 令 牌 , 当 某 个 中 心 马 上 进行 产品 线 发 布 时 , 需要 获取 该 
令 牌 。 发 布 完成 后 ， 归 还 该 令 牌 。 其 他 中 心 在 没有 得 到 令 牌 前 ， 只 能 等 待 ， 直 到 前 一 个 中 
心 释放 令 牌 。 这 就 是 典型 的 持续 集成 六 步 提交 法 。 在 这 种 情况 下， 如果 握 有 令 牌 的 业务 中 
心 因 质 量 验证 不 及 时 ， 就 会 导致 各 中 心 排队 发 布 现象 。 

这 个 持续 交付 管理 平台 同时 支持 两 个 以 上 业务 中 心 共同 发 布 一 个 版 本 。 只 要 更 新 产品 
级 版 本 配置 表 中 两 个 中 心 的 最 新 代码 标签 即 可 。 如 图 14-13 所 示 ， 某 次 发 布 必须 以 某 个 业务 
中 心 为 主 ， 其 他 中 心 被 称 为 “搭车 中 心 ”。 














外 发 质量 监控 版 本 库 主线 队列 去 求 规划 流程 规范 CI( 全 编译 ) Cl 


^* 主线 队列 (等 待 中 ) 


高 程 类 型 业务 中 心 搭车 中 心 版 本 号 合 入 需求 合 入 热 陷 what new 状态 申请 时 间 


< 主线 队列 (进行 中 ) 


高 程 类 型 业务 中 心 ”搭车 中 心 ”版 本 号 合 入 需求 合 入 款 陷 what riew 杖 态 申请 时 间 
1 主线 全 和 8.4.10023 无 1 更 新 巴 优化 秆 全 发 布 审批 2 
2 主线 启动 i G 修 改 无 发 起 合 》 
点 击 流程 可 查看 审批 记录 
时 间 操作 者 节点 名 操作 ”备注 











图 14-13 ”定制 化 的 持续 交付 管理 平台 


经 过 一 段 时 间 的 运作 ， 两 个 或 多 个 业务 中 心 一 起 发 布 版 本 的 现象 越 来 越 少 。 为 什么 
呢 ? 因为 我 们 制定 了 一 个 规则 ， 也 就 是 说 ， 当 有 合并 发 版 时 ， 如 果 因 为 质量 不 达标 ， 需 要 
回 滚 时 ,该 版 本 所 涉及 的 所 有 业务 中 心 都 需要 做 回 深 。 因 此 ， 每 个 业务 中 心 都 希望 自己 独 
立 发 版 ， 以 免 被 其 他 中 心 连累 回 深 。 当 然 ， 真正 的 持续 交付 管理 平台 所 管理 的 版 本 配置 表 
也 比较 复杂 ， 因 为 每 个 业务 中 心 会 有 多 个 代码 仓库 ， 整 个 产品 共计 12 个 代码 库 ， 并 且 配 置 
管理 和 版 本 编译 时 需要 支持 变量 ， 如 @latest、@last_good 等 。 

7. 编译 构建 云 平台 

在 研发 流程 改进 之 前 ， 每 个 业务 中 心 都 自己 管理 自己 的 编译 环境 。 当 在 产品 线 级 编译 
构建 时 ， 经 常 出 现 一 些 未 预期 的 失败 。 经 过 分 析 发 现 ， 很 多 失败 是 因为 各 业务 中 心 管理 的 
编译 机 环境 不 统一 ， 比 较 混 乱 。 于 是 ， 我 们 建立 了 一 个 产品 线 级 统一 维护 的 编译 构建 云 平 




















14.3 ”改进 的 历程 259 





台 ， 供 各 业务 中 心 统一 使 用 。 即 便 是 各 业务 中 心 发 布 的 业务 中 心 级 版 本 ， 也 是 通过 这 个 编 
译 构建 云 平台 编译 完成 的 。 为 了 提升 编译 速度 ， 还 购买 了 支持 增 量 编译 的 商业 工具 。 
14.3.4 自动 化 一 切 

现在 ,我们 建立 了 一 个 可 行 的 研发 管理 模式 ， 并 且 通 过 了 实际 和 运行 验证 。 接 下 来 就 是 
要 优化 整个 流程 的 运转 速度 ， 以 及 进一步 提升 软件 质量 。 

例如 ， 当 外 发 出 现 质量 问题 后 ， 仍 旧 使 用 人 工 方式 修改 版 本 配置 表 ， 容 易 出 错 。 每 次 
更 新 Last_good 的 版 本 号 以 后 , 向 各 团队 的 分 支 同步 代码 时 也 是 手工 方式 , 有 些 团 队 容 易 忘 
记 。 发 布 数量 变 多 ， 测 试 效率 需要 提升 。 

因此 ， 接 下 来 就 是 将 一 切 能 够 由 机 器 完成 的 工作 全 部 自动 化 ， 尽 可 能 消除 手工 操作 ， 
避免 人 为 操作 失误 ， 以 及 提高 质量 保障 效率 。 例 如 ， 我 们 建设 可 视 化 持续 交付 平台 、 自 动 
化 测试 系统 、 冲 突 可 能 性 分 析 用 例 系 统 ， 并 将 分 布 式 编 泽 引入 编译 去 平台。 这 样 ， 团 队 在 
产品 线 级 发 布 流程 中 , 从 合 入 到 发 布 的 时 间 , 从 双 线 版 本 运作 的 7 天 直接 缩短 到 了 4 个 小 时 ， 
如 图 14-14 所 示 。 
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图 14-14 ”从 合 入 到 发 布 的 时 间 对 比 
当 软 件 崩 潢 率 比较 高 时 , 我 们 专门 组 织 了 一 个 攻坚 小 组 , 将 该 指标 打压 到 一 定 的 水 平 


之 下 。 对 于 长 尾 的 月 涡 ， 不 是 很 容易 复 现 和 修复 ,我们 就 解散 了 攻坚 小 组 ， 将 发 现 的 所 有 
崩溃 分 配 到 各 业务 中 心 ， 由 各 业务 中 心 负责 自己 代码 中 的 月 潢 修复。 由 于 代码 已 经 解 灶 ， 
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只 要 根据 崩溃 反馈 上 来 的 日 志 分 析 ， 就 可 以 定位 到 具体 的 功能 模块 ， 也 就 认定 了 有 具体 的 责 
任 业 务 中 心 。 同 时 ， 我 们 还 建立 了 全 方位 的 质量 平台 ， 包 括 监控 、 分 析 和 验证 等 ， 进 一 步 
提高 效率 。 
Beta 版 本 每 天 可 以 发 布 两 个 。 为 了 能 够 让 各 中 心 及 时 与 产品 线 级 配置 中 心 的 配置 表 保 
持 一 致 ， 我 们 还 开发 了 自动 同步 机 制 。 一 旦 产品 线 级 版 本 配置 表 有 更 新 ， 就 自动 向 各 业务 
中 心 同 步 ， 使 得 各 中 心 第 一 时 间 更 新 代码 基线 ， 快 速 与 其 他 中 心 的 功能 进行 集成 ， 从 而 达 
到 6 个 业务 中 心 之 间 持 续集 成 的 效果 。 
为 了 检验 新 建立 的 一 整套 快速 发 布 、 监 探 报警 、 一 键 止 血 、 一 键 回 凌 机 制 ， 我 们 还 
进行 “消防 演习 ”。 也 就 是 说 ， 人 为 制造 有 问题 的 代码 模块 ， 在 指定 时 间 段 内 ， 随 机 向 内 
部 指定 机 器 群 组 发 布 ， 以 验证 整个 产品 团队 应 对 突 发 问题 的 流程 是 否 有 效 ， 并 不 断 加 以 
改善 。 
通过 这 些 自动 化 监控 手段 做 应 急 处 理 , 确保 对 用 户 的 影响 最 小 化 ,提升 整个 产品 线 的 
能 









































经 过 这 一 系列 的 持续 改进 后 , 该 团队 产品 线 级 版 本 发 布 可 以 做 到 一 天 双 发 。 每 周 都 会 
有 一 个 符合 全 网 发 布 质量 标准 的 候选 发 布 版 本 。 而 业务 中 心 级 的 版 本 发 布 就 会 更 多 。 尽 管 
如 此 , 用 户 也 不 会 收 到 过 多 的 升级 骚扰 , 因为 业务 中 心 级 的 版 本 是 为 了 快速 验证 功能 特性 ， 
对 用 户 都 做 了 区 隔 。 

这 次 改善 是 建立 持续 交付 “8” 字 环 的 过 程 ， 如 图 14-15 所 示 。 通 过 将 一 个 大 版 本 的 功 
能 分 拆 成 多 个 并 行 的 小 版 本 ， 在 向 全 部 用 户 发 布 之 前 ， 就 进行 小 版 本 快速 验证 ， 尽 早 获得 
用 户 反馈 。 根据 真 实 的 反馈 数据 , 来 判断 该 小 版 本 所 包含 的 功能 是 否 能 够 向 全 网 用 户 发 布 。 











构建 






提问 
7 





图 14-15 “持续 交付 “8” 字 环 


我 们 将 客户 端 软 件 架构 变 成 “ 微 核 结构 ， 然 后 将 产品 线 人 员 按 业务 导向 重新 组 织 团 
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队 ， 之 后 改变 了 整个 团队 的 分 支 发 布 策略 ， 最 后 建立 编译 构建 去 平台， 强化 发 布 后 的 监测 
系统 。 这 些 改进 不 但 达成 了 最 初 制订 的 目标 ( 即 每 月 按时 发 布 一 个 稳定 的 全 网 版 本 )， 更 
为 产品 线 创造 了 更 多 与 用 户 进行 互动 ， 进 行 快速 验证 的 机 会 。 而 且 ， 通 过 工具 平台 的 建设 
让 研发 流程 可 以 固化 到 平台 上 ， 规 则 明确 ， 减 少 了 很 多 事务 性 的 版 本 发 布 沟通 成 本 。 

将 这 些 改进 映射 到 持续 交付 七 巧 板 (如 图 14-16 所 示 ) 之 后 ， 您 可 能 会 发 现 ， 在 整个 
改进 过 程 中 ， 尽 管 我 们 按 图 中 所 示 的 顺序 着 重 改进 了 其 中 的 5 个 板块 ， 但 并 没有 对 “持续 
交付 2.0” 中 的 所 有 实践 进行 面面俱到 的 实施 。 例 如 , 我 们 并 没有 提 及 自动 化 单元 测试 和 功 
能 测试 ， 没 有 提 到 迭代 管理 、 回 顾 会 议和 故事 墙 管理 等 实践 ， 也 没有 强调 开发 人 员 的 持续 
集成 六 步 提交 法 。 事 实 上 ， 我 们 的 确 没 有 花 过 多 的 时 间 在 这 些小 团队 级 别 的 实践 上 ， 而 是 
把 更 多 的 精力 放 在 了 整个 团队 的 整体 优化 上 。 

基础 设施 




























文化 建设 
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组 织 机 制 
图 14-16 ”持续 交付 七 巧 板 


当然 ， 这 并 不 是 说 “小 团队 级 别 的 迭代 管理 、 回 顾 会 议 ， 自 动 化 测试 以 及 个 人 持续 集 
成 六 步 提交 法 ”等 不 重要 。 但 在 实施 过 程 中 ， 需 要 根据 团队 状态 、 产 品 阶段 ， 具 体 目标 的 
不 同 ， 灵 活 地 制订 方案 。 我 们 的 目的 并 不 是 引入 多 少 个 最 佳 实践 ， 而 是 在 有 限 的 时 间 里 ， 
解决 团队 面临 的 最 高 优先 级 的 问题 。 

大 型 互联 网 公司 做 持续 改进 最 重要 的 就 是 核心 管理 层 要 有 持续 改进 的 决心 , 特别 在 短 
期 改进 没有 明显 效果 的 情况 下 , 需要 管理 团队 有 坚定 的 信心 ， 并 克服 组 织 惯性 对 变革 的 阻 
力 而 坚持 下 去 。 
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章 讲述 的 是 一 个 小 型 团队 (不 足 十 人 ) 从 “死亡 行军 ”的 阴影 走出 来 , 实现 “ 零 

缺陷 交付 ”的 持续 改善 历程 。 该 团队 所 参与 开发 的 软件 产品 并 非 是 互联 网 产品 ， 
而 是 随 移动 设备 一 同 分 发 到 用 户 手 中 的 般 入 式 系统 软件 ， 其 特点 是 分 发 成 本 高 ， 铬 出 现 缺 
陷 ， 修 复 成 本 也 很 高 。 因 此 ， 我 们 无 法 使 用 第 13 章 中 所 提 到 的 测试 右 移 策略 ， 而 只 能 使 用 
测试 左 移 策略 。 
团队 已 包含 多 个 角色 ,是 一 个 全 功能 团队 , 本 次 改进 的 关键 在 于 挑战 原 有 的 工作 模式 ， 
改善 团队 成 员 的 日 常 工作 习惯。 因此 ， 整 个 改进 过 程 持续 了 整个 项 目的 开发 周期 ,并且 通 
过 引导 团队 自我 发 现 、 自 我 改善 的 方式 ， 使 团队 成 员 的 工作 方式 得 到 固化 。 


15.1 背景 简介 


N 公 司 曾 是 国际 领先 的 移动 设备 生产 商 ， 早 在 2009 年 就 开始 了 全 面 敏捷 转型 。 本 案例 
发 生 在 该 公司 的 国内 子 公 司 ， 其 研发 团队 大 约 有 500 多 人 ， 当 时 的 组 织 结构 如 图 15-1 所 示 。 
子 公司 下 设 多 条 研发 线 ， 以 及 产品 规划 线 。 每 条 业务 研发 线 对 应 于 移动 设备 某 个 功能 领域 
的 产品 研发 (如 系统 内 核 团队 、 音 视频 团队 等 )， 由 一 个 业务 线 经 理 (Line Manager) 负责 。 
该 业务 线 经 理 管理 多 个 研发 组 ,每 个 研发 组 都 有 自己 的 开发 人 员 和 测试 人 员 。 但 产品 经 理 
的 汇报 关系 并 不 在 业务 研发 线 ， 而 是 属于 规划 线 的 产品 管理 团队 (Product Management 
Team，PMT)。 这 也 与 该 公司 的 产品 形态 有 关 ， 它 生产 移动 设备 ， 而 非 直 接 面向 大 众 的 分 
发 类 软件 。 移 动 设备 的 整体 产品 战略 由 N 公 司 统一 制订 ， 面 向 全 球 不 同 的 市 场 区 域 。 每 个 
业务 研发 线 的 团队 负责 所 有 型 号 产品 在 该 业务 领域 的 开发 与 维护 工作 , 而 每 个 新 产品 的 研 
发 周期 都 需要 10 个 月 以 上 。 

当 开 启 新 产品 研发 时 ， 子 公司 以 项 目 制 形式 ， 从 各 条 服务 线 调 派 人 手 , 组 建新 产品 项 
目 组 ， 并 按 各 自负 责 的 业务 领域 划分 成 子 团队 。 图 15-1 中 的 技术 组 长 为 子 团队 的 Scrum 
Master， 而 PMT 团 队 会 指派 一 名 产品 经 理 成 为 子 团队 的 Product Owner。 这 个 新 产品 项 目 以 
Scrum of Scrums 的 模式 运行 ， 即 每 个 子 团 队 的 运作 模式 都 遵循 Scrum 框 架 ， 并 且 该 新 产品 
项 目 有 各 Scrum 之 间 的 沟通 渠道 (如 图 15-2 所 示 )。 另 外 ， 有 个 专职 持续 集成 团队 ， 负 责 该 
新 产品 持续 集成 服务 器 的 维护 ， 每 天 定时 构建 该 产品 ， 并 运行 一 些 自动 化 功能 测试 用 例 。 
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图 15-1 N 公 司 敏捷 转型 后 的 组 织 结构 示意 图 


然而 ,即便 使 用 这 种 运行 模式 ， 当 项 目 进行 到 系统 集成 阶段 时 ， 新 产品 仍旧 会 出 现 很 


多 缺陷 ， 项 目 进 度 和 质量 仍旧 有 很 高 风险 。 不 仅 如 此 ， 团 队 协 作 也 并 没有 因为 使 用 Scrum 


模式 而 变 得 更 顺畅 。 我 们 从 下 面 在 电梯 间 中 关于 “回顾 会 议 ” 的 对 话 中 “可 见 一 斑 ”。 
A: oe 
， 有 一 个 关于 新 功能 开发 的 讨论 ， 我 要 去 参加 一 下 。” 
0 你 不 参加 吗 ? 1” 
:“ 蛾 ， 幸 好 有 这 个 技术 讨论 会 ， 否 则 又 要 到 回顾 会 议 上 受罪 去 了 。” 
，“ 是 啊 ， 回 顾 会 议 解 决 不 了 什么 问题 ， 感 觉 就 像 批 斗 天 会 一 样 。” 
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图 15-2” ”Scrum 框架 
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N 公 司 的 敏捷 转型 工作 已 历时 3 年 ,各 团队 早已 拉 开 “Scrum 架 势 ”， 但是“ 有形 无 神 ， 
并 未 深入 掌握 Scrum 精 央 。 乍 一 看 ， 套 路 连贯 ， 能 够 完成 所 有 的 动作 ， 而 仔细 观察 后 ， 总 
是 觉得 每 个 动作 都 似是而非 , 没有 力道 。 在 这 种 情况 下 , 很 难 通过 宣教 方式 进行 深入 改善 ， 
只 有 以 公司 内 部 典型 团队 的 真实 改进 案例 为 支点 ， 才 能 手动 更 大 范围 的 组 织 改 善 。 因 此 ， 
业务 线 决 定 选 择 一 个 试点 团队 ， 进 行 深入 辅导 。 


15.1.1 改进 前 的 “死亡 行军 ”之 旅 


所 选 的 试点 团队 是 负责 音 视频 UI 的 研发 团队 , 他 们 在 刚刚 完成 的 产品 项 目 中 才 经 历 了 
一 次 “死亡 行军 "。 死亡 行军 ”这 个 词 源 自 Ed.Yourdon 在 1997 年 出 版 的 《Death March》 一- 
书 ， 通 常 是 指 那些 超过 预期 一 倍 以 上 时 间 的 软件 项 目 。 它 用 来 描述 按照 进度 表 儿 乎 不 可 能 
完成 的 项 目 ,说明 项 目 参与 者 的 周围 弥漫 着 的 是 难以 忍受 的 潜在 的 失败 气息 。 团 队 由 来 自 
产品 管理 部 门 的 一 名 产品 经 理 和 该 音 视 频 UI 业务 的 研发 团队 构成 ， 如 图 15-1 所 示 。 

(1) 团队 成 员 的 研发 经 验 比 较 少 。 大 部 分 开发 人 员 和 测试 人 员 在 公司 都 不 超过 半年 ， 
还 有 不 到 3 个 月 的 同事 。 

(2) 团队 士气 低落 。 在 刚刚 完成 交付 的 前 一 个 项 目 中 ,该 团队 所 负责 开发 的 特性 ， 开 
发 时 间 才 一 个 月 , 但 是 修复 缺陷 的 时 间 前 前 后 后 却 用 了 一 个 半月 ,而 且 还 伴随 着 很 多 加 班 。 


15.1.2 ”改进 后 的 无 缺陷 交付 


所 选择 的 项 目 是 一 款 新 型 移动 设备 的 操作 系统 级 产品 研发 , 需要 3 个 大 研发 线 团队 ( 硬 
件 团 队 、 平 台 研发 团队 和 软件 研发 团队 ) 参与 ， 项 目 团队 共 200 多 人 ， 整 个 产品 的 研发 周 
期 预计 10 个 月 。 其 中 ,软件 研发 团队 大 约 包括 100 多 人 ， 根据 所 负责 业务 功能 模块 的 不 同 ， 
分 成 多 个 Scrum 团 队 。 作 为 一 款 移动 设备 产品 的 研发 项 目 ， 其 与 互联 网 产品 的 研发 有 很 大 
的 不 同 ， 例 如 : 

e 项 目 研 发 周期 长 (超过 6 个 月 的 时 间 ); 

。 参与 人 员 多 ( 约 200 信 ); 

。 质量 要 求 高 《因为 功能 手机 售卖 后 若 有 问题 ， 名 回 修复 成 本 很 高 ， 所 以 要 求全 面 
且 彻底 的 质量 控制 ， 尽 可 能 无 缺陷 交付 ) 

。 大 型 遗留 系统 。 该 系统 已 经 有 10 年 的 历史 ， 整 个 代码 库 超 过 1500 万 行 代码 。 

经 过 数 月 努力 , 音 视频 UI 研发 团队 取得 了 此 前 没有 任何 团队 能 够 取得 的 成 绩 
且 无 缺陷 地 交付 软件 功能 。 

e 时 间 与 范围 : 即便 在 研发 后 期 新 增 了 优化 需求 ， 仍 旧 按 时 间 完 成 研发 任务 。 

e 产品 质量 : 负责 开发 的 所 有 功能 在 交付 后 ， 经 验证 未 发 现任 何 缺 陷 。 

。 协作 流程 : 团队 气 弃 了 很 多 原来 的 工作 流程 ,建立 了 全 新 软件 研发 工作 实践 。 例 如 : 

4 使 用 需求 拆 分 (用 户 故 事 ) 与 相对 估算 方法 ; 
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建立 以 小 需求 (用 户 故 事 ) 流动 为 主 的 看 板 实践 ， 不 再 跟踪 个 体 活动 与 任务 ， 
使 用 主干 开发 模式 ， 
开发 人 员 编 写 自动 化 单元 测试 ; 


每 个 小 需求 拆 分 成 多 个 开发 任务 进行 
每 个 任务 完成 即 向 主干 提交 代码 ; 
每 个 小 需求 完成 后 即 进行 需求 功能 验收 测试 。 


15.2 ”改进 方法 论 


大 团队 的 转型 路 径 与 小 团队 的 改善 路 径 完 全 不 同 。 大 团队 从 整体 结构 入 手 更 加 有 效 ， 
而 对 小 团队 来 说 ， 由 于 其 掌握 资源 较 少 ， 决 策 影响 小 ， 因 此 ， 应 该 更 加 关注 团队 内 部 的 持 
续 改 善 。 


15.2.1 指导 思想 


“目标 驱动 ， 从 简单 问题 开始 ， 持 续 改 善 ” 的 指导 思想 是 不 变 的 。 经 过 与 团队 的 管理 
者 〈 也 就 是 业务 线 总 负责 人 ) 讨论 后 ， 确 定 了 音 视频 UI 研发 团队 在 这 个 试点 项 目 过 程 中 ， 
需要 达成 的 目标 。 

。 时 间 与 范围 : 在 规划 时 间 表 内 ， 完 成 该 业务 领域 的 功能 特性 开发 。 

。 质量 : 产品 研发 质量 一 次 性 达标 。 

。 流程 : 建立 良好 的 工作 流程 习惯 ， 团 队 经 验 可 以 固化 。 


15.2.2 试点 团队 的 选择 


选择 试点 团队 通常 考虑 以 下 4 点 。 

(1) 项 目 压力 适中 ， 有 相对 富裕 的 时 间 (slack time)。 毕 竟 需 要 团队 中 的 每 一 个 人 都 
要 有 能 力 提升 ， 并非 只 是 工作 流程 的 改变 。 如 果 一 个 项 目的 时 间 压 力 巨 大 ,研发 团队 已 经 
“疲于奔命 “， 那 么 ， 团 队 成 员 通 常会 拒绝 一 切 改变 。 因 为 对 团队 来 说 ， 此 时 的 任何 改变 都 
有 很 高 的 不 确定 性 ， 是 一 个 巨大 的 风险 ,但 是 也 不 能 没有 项 目 压力 。 如 果 没 有 交付 压力 ， 
那么 在 组 织 中 也 无 法 起 到 试点 效果 ， 失 去 了 试点 的 意义 。 

(2) 团队 负责 人 心态 开放 ， 能够 承受 压力 ， 勇 于 尝试 。 这 种 改变 对 团队 的 每 个 人 都 是 
一 种 挑战 ， 但 对 团队 负责 人 的 挑战 最 大 。 因 为 他 (她 ) 仍旧 要 对 最 终 的 软件 交付 负 主 要 责 
任 。 如 果 没 有 开放 的 心态 ， 在 压力 面前 ， 很 容易 按 原 有 习惯 处 理 面 对 的 问题 与 挑战 。 一 旦 
如 此 ， 就 会 陷入 自我 封闭 的 保护 状态 。 

(3) 团队 成 员 有 热情 。 假 如 团队 成 员 对 即将 进行 的 改变 并 没有 热切 的 渴望 ,在 改进 过 
程 中 就 会 缺乏 积极 的 思 芳 ， 缺 少 互动 与 反馈 。 在 试点 结束 后 ， 也 无 法 形成 强烈 的 自豪 感 和 
成 就 感 。 这 将 与 试点 团队 的 意义 和 初 囊 不 符 。 
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(4) 业务 方 有 频繁 及 快速 频繁 交付 的 强烈 诉求 。 如 果 业 务 方 在 这 方面 的 诉求 不 高 ， 
那么 即便 团队 掌握 了 各 项 技能 ， 由 于 得 不 到 业务 方 的 积极 反馈 ,将 使 团队 的 交付 成 果 黯 
然 失 色 。 

我 与 某 业务 线 管理 者 进行 了 充分 的 沟通 ， 达 成 一 致意 见 。 根 据 新 产品 项 目的 需求 状态 ， 
以 及 团队 负责 人 的 能 力 和 团队 成 员 的 热情 , 在 其 负责 的 儿 个 子 业 务 领域 团队 中 选择 试点 团队 。 


15.3 第 一 阶段 : 研发 准备 期 


试点 开始 时 ,该 产品 项 目 已 经 进入 研发 准备 期 。 产 品 经 理 和 技术 组 长 已 经 拿 到 了 其 所 
负责 的 功能 需求 列表 (productbacklog)， 并 且 技 术 组 长 进行 了 初步 估算 ， 估 算 单 位 为 “人 
周 ”， 如 图 15-3 所 示 。 团 队 内 的 其 他 开发 人 员 和 测试 人 员 尚 不 了 解 具体 的 开发 内 容 。 细心 的 
读者 会 发 现 这 个 功能 列表 有 以 下 特点 。 

(1) 图 中 有 两 个 史诗 级 故事 (图 15-3 中 的 和 @)， 每 个 史诗 级 故事 包括 多 个 用 户 故 


























= 
入 


(2) 每 个 用 户 故 事 都 是 按照 “As a user, Pd like to do xxxx” 的 格式 书写 。 
(3) 每 个 用 户 故 事 都 有 一 个 业务 优先 级 〈 图 1553 中 的 第 一 列 数字 ) 。 
这 也 说 明 ， 团 队 接 受过 Scrum 培 训 ， 对 Scrum 运 作 流 程 比较 了 解 。 


: 更 请 CD 
优先 级 用 户 故事 (User stoy) 


Easy Editing-Video Editing mode Ul) 


As an user fd like to enter the edit mode by choose “Replace 
voice” 


As an user | want to see the progress bar in the editing mode 


5 
As an user, | want to see the current playing time and length of 
the progress 0.5 
1 
1 
1 
1 





As an user I'm able to adjust the volumn in the editing mode 


As an user After | choose“Replace voice”in opthon menu, current 
video should start to play from the top 
As an user After | choose“Replace voice”in opthon menu, MSK 


As an user After | choose “Replace voice” in opthon menu, play eel 
ICon 


国王 一 Depends on video MO design, current effort based on simple 
design 


Easy Editing-Video Editing mode UD 
en 
the original sound in video clip. 
fn vser rahe to croose ne sian pomi ofrocorang mougn | 2 
| As an user, fd like to start recording by press MSK ( “select” key) 
一 Depends on video MO design, current effort based on average 
design 














图 15-3 ”原始 的 功能 需求 列表 示意 图 
15.3.1 功能 简介 与 需求 拆 分 
团队 召开 了 产品 功能 介绍 会 ， 由 产品 经 理 讲解 图 15-4 中 的 功能 需求 ， 并 将 这 个 功能 列 
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表 进 一 步 拆 分 与 重组 。 对 一 个 开发 经 验 较 少 的 人 员 来 说 ， 每 个 需求 的 估算 时 间 越 长 ， 准 确 
性 就 越 低 。 同 时 ， 大 块 的 需求 也 不 利于 产品 人 员 、 技 术 人 员 和 测试 人 员 对 需求 的 理解 和 沟 
通 ， 容 易 产 生 歧 义 ， 对 后 续 开发 质量 和 效率 都 有 负面 影响 。 








| 序号 | 依赖 外 部 | 用户 故事 | 估算 点 数 
ULogl [sanwserrdmwetoseeanoptontocpmymusowoceme | 
Uo02 Buding UT ramewor or Audio cippng Delegate and runiocaly | 
Uo03 Greato mo skoleion oro RudioCippnaDoiegaie | 
U04 Ware mo Audio Ciporia Delegado unit test run automaicay | 
As an user 1d like to enter the edit mode by choose “Clip” from opton menu 
UL005 一 Launch the Audio Clipping Delegate when selecting the Clip option from the 


If Core_005 CAN be done before UL_006, user story is 

一 User Edit Delegate interface with delayed feedback 

If Core_005 CAN NOT be done before UL 006, user story is: 
UI_008 Core_005 | 一 Fake functionlity in Ul layer (copy file in FS) 


As an user |'d like to have a visual indicator while saving file. 
Ul_oor 一 Stqrt the Audio Clipping controller and make htat clip the predefined file 


UL008 Handle end key pressed on the wait note (Saving process) 
UL009 Current track in NPS as input to the Audio Clipping Delegate 
UL024 Spike on US_014 


As an user After | choose“Clip”in option menu, current music should start to 
play from the top: 


一 Create a new MO MO clip which inherit from MO Sound 
一 Make the Audio Clipping Controller create it 
Ul_014 Core_005 | 一 Makethe MO Make the MO Clip have the interface to the Tone Server have the interface to the Tone Server 





Ul_012 As an user, After | choose “Clip” in option menu, MSK change to “Select” 


As an user, |'d like to see a progress bar which can indicate: 
UL013 一 Music playing progress 


UL015 As an user I'd like to use MSK to mark the start point 
Ul_016 As an user After start point marked, I'd like to use MSK to mark the end point 
Ul_017 Display FF button in the Audio Clipping UI Delegate 


图 15-4” 拆 分 后 的 需求 列表 及 估算 点 数 


于 实 证 明 ， 的 确 在 需求 拆 分 过 程 中 ,团队 发 现 并 澄清 了 一 些 原本 存在 的 需求 理解 不 一 
致 问题 , 还 有 一 些 业务 场景 , 是 产品 经 理 没 有 事先 想到 的 。 最 后 的 需求 列表 如 图 15-4 所 示 。 
关于 详细 的 需求 拆 分 方法 参见 6.3 市 。 
细心 的 读者 可 能 会 发 现 图 中 的 一 些 细 市 问题 。 估 算 并 不 是 在 这 个 时 候 做 的 ， 而 是 完 
下 面 的 活动 以 后 加 上 去 的 , 而 且 , 列表 中 的 一 些 条 目 与 教科 书 上 对 用 户 故 事 的 要 求 也 不 一 样 。 
。 技术 实现 注释 : 条 目 UL 014 同 时 也 标注 了 如 何 实 现 ( 见 图 中 带 有 下 划 线 的 文字 )。 
。 题目 格式 没 那么 重要 : UL 017 没 有 按 用 户 故 事 的 标准 格式 写 。 
。 特别 的 用 户 故 事 : 条 目 UI_024 的 名 字 叫 “Spike on US_014”。" 这 是 由 于 团队 评估 
认为 US_014 的 实现 方式 非常 不 确定 ， 需 要 事先 做 一 点 研究 。 


15.3.2 ”架构 设计 与 需求 依赖 识别 
需求 拆 分 的 同时 ， 团 队 还 进行 了 一 些 设计 上 的 讨论 。 由 于 这 个 功能 在 之 前 的 产品 中 根 











尾 
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Q@ Spike 是 穿刺 的 意思 ， 表 示 快 速 了 解 和 尝试 。 
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本 没有 提供 过 ， 我 们 希望 将 其 与 原 有 的 系统 代码 进行 隔离 ， 通 过 提供 一 个 代理 层 ， 实 现 与 
原 有 系统 的 交互 ， 这 是 设计 模式 中 典型 的 门面 模式 (Facade pattern)。 通 过 这 种 设计 隔离 ， 
可 以 保障 该 功能 的 独立 性 ,后 期 容易 做 功能 
增强 或 代码 维护 ， 其 示意 图 如 图 15-5 所 示 。 : 

这 其 实 是 一 次 小 的 架构 解 耦 设计 ， 团 遗留 代码 ™ 
队 需 要 付出 一 些 额 外 的 工作 量 。 另外 , 在 讨 
论 中 也 识别 出 了 一 些 需求 依赖 ,这 些 依赖 既 
包括 团队 内 部 这 些 需 求 之 间 的 依赖 关系 , 同 图 15-5 ”架构 解 硝 示意 图 
时 也 包含 对 其 他 团队 功能 的 依赖 关系 。 例 如 , 条 目 UL006 和 ULI_014 需 要 依赖 音 视 频 中 间 件 
团队 (Core 团 队 ) 的 005 号 需求 提供 的 接口 才能 完成 。 

在 此 之 后 ,团队 马上 安排 了 一 个 会 议 , 讨论 进入 正式 开发 阶段 之 后 ， 团 队 应 该 执行 哪 
些 活动 ， 来 确保 完成 我 们 的 质量 与 进度 目标 。 在 讨论 结束 后 ， 团 队 确 定 将 引入 3 个 新 的 实 
践 ， 分 别 是 自动 化 单元 测试 、 提 交 前 的 代码 评审 和 编码 规范 检查 。 这 就 是 图 15-5 中 会 存在 
条 目 UL 002 和 ULI 004 的 原因 。 它 们 并 不 是 用 户 故 事 , 而 是 为 了 提升 质量 和 效率 ， 团 队 认 为 
必须 投入 的 两 个 技术 任务 。 


15.3.3 ”工作 量 估算 与 排 期 


需求 拆 分 请 楚 之 后 ， 就 到 了 工作 估算 和 排 计划 的 时 候 了 s 有 的 同事 提出 了 一 些 疑 问 ， 
例如 : 



















































































“如 果 我 们 写 单元 测试 ， 原 来 的 工作 量 估 计 是 否 要 翻 倍 ? 

“因为 我 们 没有 写 过 单元 测试 ， 所 以 是 否 要 加 上 学 习 单元 测试 的 时 间 ? 
“我 们 代码 评审 的 时 间 需 要 加 多 少 呢 ? 

“测试 时 间 是 否 需要 单独 估算 ? ” 


最 后 ， 团 队 使 用 了 一 种 新 的 工作 量 估算 方法 ， 即 点 数 估算 ， 这 是 一 种 没有 时 间 单 位 的 
相对 大 小 估算 。 这 种 方法 基于 以 下 几 种 假设 。 

(1) 开发 活动 永远 应 该 是 整个 流程 中 的 瓶颈 (这 也 是 最 理想 的 价值 流动 状态 )。 也 就 
是 说 ， 某 个 需求 完成 后 可 以 很 快 完成 测试 工作 。 那 么 ， 相 对 开发 时 间 来 说 ， 测 试 独占 周期 
则 可 以 忽略 不 计 ， 如 图 15-6 所 示 。 

(2) 从 功能 需求 开发 的 整体 工作 量 角度 来 看 ， 我 们 可 以 近似 地 认为 ， 需 求 开 发 的 工作 
量 越 大 ， 甚 单元 测试 及 代码 评审 的 工作 量 也 越 大 。 也 就 是 说 ， 对 i 和 k 两 个 需求 来 说 ， 甚 编 
写 和 调试 代码 所 需 工作 量 之 比 ， 与 其 单元 测试 所 需 工作 量 以 及 代码 评审 所 需 工 作 量 之 比 相 
近 , 如 图 15-7 所 示 。 图 中 大 为 其 个 需求 的 编码 调整 工作 量 ; 了 为 该 需求 的 自动 化 测试 工作 量 ， 
用 为 该 需求 的 代码 评审 工作 量 。 因 此 ， 在 做 工作 量 估算 时 ， 可 以 仅 考虑 需求 开发 的 工作 量 。 
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团队 需求 团队 开发 能 力 ”团队 测试 能 力 
分 析 能 力 


-- ---~ 需求 的 流动 速度 


图 15-6 ”流动 速度 受 限 于 整个 管道 的 最 小 瓶颈 
Re 
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Fw 
图 15-7 开发、 单元 测试 及 代码 评审 工作 量 成 比例 


具体 的 估算 方法 可 以 参见 附录 B。 需 要 注意 的 是 ， 既 然 是 估算 ， 那 么 总 会 有 偏差 。 偏 
差 的 大 小 与 很 多 因素 有 关 ， 但 只 要 拆 分 后 的 需求 大 小 相当 ， 且 工作 量 少 于 1 人 周 ， 对 较 长 
周期 的 软件 项 目 来 说 ， 偏 差 通常 可 以 接受 。 

经 过 需求 拆 分 与 估算 ， 我 们 得 到 了 全 新 的 用 户 故事 列表 和 工作 量 ， 如 图 15-4 所 示 。 在 
这 个 列表 当中 ， 共 计 有 39 个 用 户 故 事 ， 总 规模 为 120 个 点 。 

现在 团队 得 到 了 项 目 总 工作 量 ， 接 下 来 就 是 预 估计 算 项 目 完 成 的 时 间 了 。 当 讨论 每 个 
迭代 可 以 完成 的 工作 量 时 ， 需 要 考虑 以 下 4 个 因素 。 

(1) 最 初 3 个 迭代 工作 产 出 会 有 所 下 降 。 由 于 在 项 目 启动 开发 后 ， 团 队 还 需要 一 些 准 
备 工作 , 例如， 团队 级 别 的 持续 集成 服务 器 及 自动 化 构建 脚本 、 学 习 自 动 化 单元 测试 的 编 
写 、 熟 悉 新 的 工作 流程 等 。 

(2) 在 3 个 迭代 后 ， 工 作 速 度 会 有 所 提升 。 因 为 那 时 的 基础 工具 准备 已 完成 ， 团 队 成 
员 已 经 熟悉 工作 流程 ， 并 且 自 动 化 单元 测试 会 为 我 们 修改 代码 提供 一 个 “保护 网 ”"， 及 时 




































































发 现 问题 。 
(3) 虽然 对 结果 有 信心 ， 但 技术 组 长 仍旧 为 了 有 更 大 的 把 握 ， 加 了 1.5 个 迭代 的 缓冲 
时 间 。 





(4) 团队 工作 时 间 的 构成 。 我 们 排除 了 公休 日 与 市 假日 的 时 间 ， 且 平时 按照 正常 作息 
时 间 上 下 班 (晚上 不 加 班 )。 由 于 时 间 跨 度 大 ， 征 询 了 团队 所 有 人 的 休假 安排 ， 将 休假 蚀 
除 在 计划 之 外 。 

根据 上 面 的 估算 和 时 间 、 速 度 因 素 ， 我 们 前 3 个 迭代 中 ， 每 个 迭代 计划 完成 9 个 点 的 工 
作 量 ， 之 后 完成 13 个 点 的 工作 量 ， 如 图 15-8 所 示 。 值 得 注意 的 是 ， 这 里 所 说 的 “完成 ”并 
不 是 指 开发 人 员 的 开发 活动 完成 ， 而 是 指 测试 人 员 验 收 通过 才 算 “ 完 成 "。 
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1 2 3 4 5 6 7 8 9 10 1 12 
图 15-8 ”项目 原始 计划 燃烧 图 
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当 需 求 拆 分 、 工 作 量 估算 以 及 项 目 排 期 完成 后 ,- 接 下 来 就 进入 了 正式 的 软件 交付 期 。 
这 一 时 期 是 团队 实现 真正 转变 的 重要 阶段 。 因 为 ;在 没有 得 到 最 终结 果 〈 即 软件 交付 ) 
之 前 ， 研 发 准备 期 所 做 的 一 切 活动 尚 无 法 让 团队 对 软件 交 特 有 信心 。 在 这 一 过 程 中 ， 通 
过 引导 团队 识别 问题 、 持 续 改 善 ， 让 团队 成 员 共 同 参 与 流程 改进 与 建设 ， 从 而 实现 团队 
自 组 织 。 


15.4.1 通过 可 视 化 看 板 改 进 工作 流程 


看 板 (Kanban) 方法 首先 是 一 种 发 现 流程 问题 的 有 效 方法 。 通 过 可 视 化 当前 的 流程 状 
态 ， 识 别 存在 的 问题 ， 并 快速 制订 和 实施 相应 的 对 策 ， 从 而 持续 改进 ， 达 到 提升 效率 的 目 
标 。 我 们 接 下 来 就 介绍 这 个 团队 通过 将 流程 可 视 化 来 识别 和 解决 问题 的 过 程 。 

1. 识别 坏 味道 

在 这 个 项 目 之 前 ， 整 个 团队 每 个 欠 代 只 能 交付 两 个 需求 。 由 于 需求 粒度 较 大 ， 这 两 个 
需求 一 直 贴 在 大 白板 的 左边 ， 一 动不动 , 直到 友 代 结束 。 大 和 白板 的 右边 写 着 团队 成 员 的 人 
名 ， 之 后 就 只 有 3 列 ， 分 别 是 To Do (已 计划 )、Doing (进行 中 ) 和 Done (完成 )。 每 一 列 
中 贴 着 团队 成 员 的 具体 工作 任务 ， 每 个 成 员 拥 有 一 个 甬道 ， 如 图 15-9 所 示 。 

这 个 故事 墙 布 局 有 两 个 坏 味道 , 一 是 为 期 两 周 的 迭代 , 一 个 团队 只 做 两 个 工作 量 很 大 
的 用 户 故 事 Storyl1 和 Story2; 二 是 开发 人 员 和 测试 人 员 的 任务 分 解 模板 化 ， 通 常 如 表 15-1 
所 列 ， 这 完全 符合 第 6 章 所 讲 的 ， 以 传统 瀑布 开发 方式 进行 任务 分 解 的 方法 。 






































15.4 第 二 阶段 : 软件 交付 期 271 












| 到 


Rosa (测试 | [ 刀 [I [TD [yp Ly Dy 





图 15-9 ”原始 的 任务 墙 (用 于 跟踪 成 员 的 工作 任务 ) 
表 15-1 开发 人 员 与 测试 人 员 的 任务 分 解 





开发 人 员 测试 人 员 





(a) 设计 <X > 模块 
(b) 修改 <X > 模块 
(c) 对 <X > 模块 修改 进行 代码 评审 


(a) 写 Story<A > 的 测试 用 例 
(b) 对 Story<A > 进行 测试 











这 两 种 坏 味道 可 能 会 引起 3 个 问题 。 

(1) 集成 时 间 太 晚 。 只 有 本 次 妈 代 末期 ， 才 能 将 开发 人 员 的 代码 集成 在 一 起 ， 开 始 对 
这 两 个 需求 的 测试 ， 集 成 时 间 太 靠 后 ， 质 量 在 过 程 中 不 可 控 。 

(2) 开发 任务 的 质量 无 法 验证 。 在 工作 过 程 中 ， 并 无 具体 完成 的 工作 内 容 标 准 ， 仅 仅 
按 工作 活动 本 身 的 类 型 进行 拆 解 。 

(3) 测试 人 员 写 了 测试 用 例 ， 只 能 在 进 代 后 期 集成 时 间 才 能 用 到 。 

2. 让 价值 流动 起 来 

在 本 项 目 中 ， 我 们 把 那些 像 模板 一 样 的 任务 类 型 当 作 故事 墙 的 “栏目 ， 放 在 列 首 ， 
而 将 拆 分 后 的 用 户 故 事 ( 细 粒 度 需 求 ) 作为 工作 项 ， 放 到 故事 墙 上 对 应 的 状态 栏 中 。 随 着 
开发 工作 的 进行 ， 这 些 细 粒 度 需 求 从 白板 左 侧 向 右 侧 流动 。 每 当 一 个 用 户 故 事 走 到 最 后 一 
列 (完成 ") 时 ， 就 代表 着 验收 合格 ， 甚 故事 点 数 可 以 计 入 “ 迭 代 速 度 ” 。 这 样 ， 团 队 在 
每 时 每 刻 都 可 以 看 到 真实 的 项 目 (需求 ) 进展 ， 如 图 15-10 所 示 。 

你 也 许 已 经 注意 到 在 “开发 ”一 栏 中 ,第 一 个 需求 的 右上 角 有 一 个 小 纸 条 , 写 着 “bug”。 
在 真实 的 故事 墙 上 ， 那 是 一 个 红色 纸 条 ， 附 在 该 需求 上 。 这 个 状态 说 明 ， 它 已 经 开发 完成 
了 ， 但 在 测试 过 程 时 发 现 了 bug。 测 试 人 员 将 缺陷 简写 在 红色 纸 条 上 ， 并 贴 在 该 需求 卡 ， 
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将 其 放 回 到 “开发 ”一 栏 ， 由 开发 人 员 自 行 修复 。 


-一 -一 -------- 一 -一 - 需求 流 动 的 方向 -------------------* 














图 15-10 ”以 价值 流动 为 核心 的 故事 墙 
“阻塞 ”一 栏 中 放 入 那些 已 经 启动 开发 ， 但 是 在 过 程 中 由 于 外 部 原因 (如 外 部 依赖 、 
外 部 环境 没有 准备 好 等 ) 而 暂时 无 法 继续 进行 的 需求 = 这 一 栏 需要 Scrum Master 特 别 关 注 ， 
并 推进 解决 。 

















测试 人 员 的 困惑 

(1) 测试 相关 的 工作 (如 编写 测试 用 例 ) 在 故事 墙 上 怎么 体现 呢 ? 

在 故事 墙 上 , 我 们 只 跟踪 需求 状态 的 变化 ， 并 不 是 为 了 记录 团队 成 员 每 个 人 的 工作 
量 。 而 被 放 入 “ 待 开 发 状态 栏 ” 中 的 需求 ， 就 应 该 是 写 好 验收 条 件 或 测试 用 例 的 需求 了 。 

(2 ) 什么 时 候 写 测试 用 例 ? 

我 们 希望 在 进入 一 个 迁 代 以 前 , 尽 可 能 准备 好 该 迭代 中 每 个 需求 的 测试 用 例 。 但 是 ， 
需要 保证 的 是 在 开发 人 员 居 动 该 需求 的 开发 之 前 ， 一 定 写 好 测试 用 例 ， 并 且 评 审 通过 ， 
评审 形式 不 限 ， 既 可 以 通过 电子 邮件 ， 也 可 以 通过 小 范围 当面 沟通 

3. 显 式 声明 “完成 ”的 标准 定义 

很 多 开发 同事 都 是 “新 手 ”， 为 了 让 大 家 能 够 快速 了 解 系统 架构 ， 熟 练 且 正确 地 使 用 
现成 的 系统 开发 框架 ， 从 而 保证 代码 质量 ,减少 后 期 缺陷 太 多 的 返工 ， 在 项 目 启动 会 上 ， 
团队 曾经 做 了 两 项 约定 : 一 是 需求 在 启动 开发 之 前 ， 要 写 模 块 设计 文档 ， 并 经 过 评审 ， 才 
能 开始 编写 代码 ， 二 是 编写 完 代码 之 后 要 做 代码 评审 。 然 而 ， 在 项 目 实际 运行 过 程 中 ， 开 
发 人 员 却 并 没有 这 么 做 ， 而 是 在 代码 编写 完成 之 后 ， 才 补 写 设 计 文档 。 

在 迭代 回顾 会 议 上 , 我 们 重新 强调 了 这 个 要 求 , 而 且 明 确 了 每 次 挪动 Story 时 必须 完成 
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的 活动 。 为 了 时 刻 提 醒 每 个 人 ， 我 们 还 把 它 打印 出 来 ， 贴 在 了 每 个 栏目 之 间 ， 如 图 15-11 
所 示 ， 这 被 称 为 “完成 的 定义 ”(Definition of Done，DoD) ， 其 状态 迁移 条 件 如 下 。 
。 待 开发 一 设计 : 验收 条 件 (或 测试 用 例 ) 必须 写 完 ， 并 经 过 产品 人 员 、 开 发 人 员 
和 测试 人 员 共 同 评审 ， 没 有 异议 。 
。 设计 一 开发 : 完成 设计 文档 的 更 新 ， 设 计 评 审 完 成 。 
e 开发 一 测试 : 编写 对 应 的 自动 化 单元 测试 ， 确 保 所 有 单元 测试 用 例 成 功 通过 ， 完 
成 代码 评审 。 
。 测试 一 完成 : 全 部 测试 用 例 都 能 通过 ， 所 有 人 缺陷 被 修复 。 























图 15-11 DoD (“完成 ”的 标准 
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4. 涂鸦 设计 ， 消 除 浪费 
我 们 用 字母 来 表示 需求 所 处 的 状态 ，D 代 表 “ 设 计 ”(design) 一 天 ，C 代 表 “ 开 发 ” 
(coding) ，T 人 代表“ 测试 ”(testing) ，B 代 表 “ 阻 塞 ”(blocked)。 同 时 每 天 站 会 时 用 代表 字 
母 来 记录 每 个 需求 在 该 状态 的 停留 时 长 (并 没有 no js oo 
精确 到 小 时 ， 而 只 记录 到 天 )。 如 图 15-12 所 示 ， 名 称 : Display the music 
需求 US_009 在 设计 状态 持续 了 2 天 ， 在 开发 状态 。 | 和 
持续 了 3 天 ， 被 阻塞 了 1 天 ， 测 试 已 经 进行 了 1 天 。 外 用 时 记录 
技术 组 长 发 现 了 一 个 奇怪 现象 。 简 单 的 需求 ppcccer”| Se 
与 复杂 的 需求 相 比 ， 在 “设计 状态 ”的 时 长 上 并 pe 
没有 显著 差异 。 这 是 为 什么 呢 ? 通过 观察 每 个 人 
的 工作 方式 ， 他 找到 了 原因 。 原 来 ， 每 个 人 在 拿 到 一 个 新 需求 时 ， 习 惯性 的 行为 是 下 面 这 
样 的 。 
1 


(1) 
(2) 
(3) 
(4) 
(5) 























自己 先 在 Word 文 档 中 编写 相关 模块 设计 。 
再 发 邮件 给 其 他 开发 人 员 评 审 。 

等 对 方 给 他 回复 邮件 后 。 

再 根据 邮件 中 的 内 容 修改 Word 文 档 。 
修改 完成 后 才 算 设 计 完 成 。 
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工作 步骤 并 没有 问题 , 问题 在 于 工作 的 方式 。 当 使 用 Word 文 档 进 行 编写 时 ， 人 们 会 花 
时 间 在 文档 的 美化 上 (这 是 一 个 很 自然 的 事情 ,， 谁 都 想 让 自己 画 出 来 的 设计 图 好 看 一 些 )。 
然而 ， 在 没有 确定 这 个 设计 的 有 效 性 之 前 ， 这 种 文档 美化 工作 是 一 种 浪费 。 因 此 ， 我 们 改 
变 了 一 下 要 求 ， 让 大 家 做 “白板 上 的 设计 ”， 即 工作 流程 与 方式 分 为 以 下 步骤 。 

(1) 开发 人 员 Sara 拿 到 一 个 需求 后 ， 自 己 做 初步 设计 。 不 需要 写 Word 文 档 ， 只 要 用 笔 
在 白 纸 上 画 一 画 就 行 。 

(2) Sara 邀 同事 一 起 到 白板 前 ， 一 边 在 白板 上 画 ， 一 边 给 大 家 讲 (一 般 只 需要 5 分 钟 
左右 ) 。 

(3) 大 家 直接 给 出 反馈 和 改进 建议 。 

(4) Sara 根 据 讨论 结 果 ， 编 写 设计 文档 。 

(5) 提交 文档 ， 完 成 设计 。 

虽然 也 是 5 个 步骤 ,但 是 这 里 消除 了 两 种 浪费 。 一 是 对 Word 文 档 不 必要 的 美化 环节 。 
二 是 等 待 回复 邮件 的 环节 。 团 队 并 不 需要 到 会 议 室 去 找 白 板 ， 在 团队 的 办 公 桌 旁边 就 有 一 
块 。 假 如 需要 走 到 很 远 的 会 议 室 才 能 讨论 ， 那 么 就 是 一 个 很 麻烦 的 事情 ， 人 们 会 因为 惰性 
而 放弃 很 多 讨论 的 机 会 。 同 时 ， 如 果 走 得 很 远 ， 也 是 一 种 不 必要 的 浪费 。 

这 种 改进 之 后 ， 需 求 在 设计 状态 的 时 长 明显 缩短 了 很 多 、 

5. 明确 状态 ， 关 注 需求 的 快速 流 天 

我 们 还 注意 到 ， 在 故事 墙 的 “开发 ”一 栏 中 ， 经 常 有 需求 卡片 堆积 现象 。 经 过 了 解 发 
现 ， 每 个 开发 人 员 把 手 上 的 需求 开发 完 以 后 ， 就 会 发 邮件 给 代码 评审 者 ， 并 提示 对 方 。 然 
后 ， 他 马上 就 会 拿 下 一 个 需求 ， 开 始 启动 设计 开发 。 

代码 评审 者 本 身 也 是 开发 人 员 ， 自 己 也 在 开发 需求 ， 这 个 需求 可 能 还 很 棘手 。 此 时 ， 
代码 评审 者 本 身 通 常 的 做 法 是 : 尽快 完成 自己 手中 的 开发 工作 , 然后 再 去 评审 别人 的 代码 。 
因为 每 个 人 都 有 这 种 倾向 , 所 以 会 产生 卡片 在 “开发 ”一 栏 上 堆积 。 很 多 需求 开发 完成 了 ， 
但 是 在 “开发 ”一 栏 中 ， 等 待 代码 评审 。 

于 是 ， 团 队 在 故事 墙 上 增加 了 一 栏 ， 名 为 “代码 评审 ”(codereview)。 当 开发 人 员 完 
成 手中 需求 的 开发 ， 并 发 出 代码 评审 邮件 后 ， 就 可 以 将 这 个 需求 移动 到 “代码 评审 ”一 栏 
中 。 这样 , 我 们 就 可 以 清楚 地 知道 , 哪些 需求 是 在 开发 中 的 , 哪些 需求 是 在 代码 评审 中 的 ， 
如 图 15-13 所 示 。 
团队 还 约定 ， 当 发 出 代码 评审 申请 后 ， 需 要 告知 代码 评审 者 。 如 果 代 码 评审 者 在 两 个 
小 时 内 还 没有 回复 的 话 ， 开 发 者 需要 再 次 提醒 他 。 这 参考 精益 理论 中 的 流动 原则 ， 即 让 在 
制品 (work in progress，WIP) 在 整个 价值 流 中 快速 地 流动 起 来 ， 否 则 会 对 下 游 工 作 造 成 
不 良 影响 ， 例 如 ， 大 批 工作 的 积压 使 下 游 工 作 负 担 不 均衡 。 

6. 避免 不 必要 的 任务 切换 

在 一 次 返 代 回顾 会 议 中 ，Rosa (测试 人 员 ) 提出 了 两 个 不 好 的 现象 : 一 是 有 一 些 需 求 
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有 非常 明显 的 缺陷 ， 也 会 进入 测试 环境 ， 二 是 缺陷 被 提出 来 以 后 ， 即 便 是 简单 的 缺陷 ， 也 
要 等 上 一 段 时 间 才 能 修复 好 。 





图 15-13 ”增加 “代码 评审 "， 明 确 状 态 

原来 ， 开发 人 员 习 惯 于 先 念 完 手 中 的 新 工作 ， 再 来 修复 这 些 缺 陷 。 这 里 存在 两 个 “ 坏 
味道 ”: 一 是 开发 人 员 对 需求 的 自 测 不 充分 ， 有 将 测试 人 员 当 “小 工 ”的 嫌疑 ， 二 是 不 能 
马上 着 手 修复 缺陷 。 根 据 之 前 的 团队 约定 ， 开 发 人 员 要 根据 每 个 需求 的 验收 条 件 ， 进 行 开 
发 自 测 ， 确 保 没 有 明显 问题 。 为 了 再 次 强调 这 一 点 ， 我 们 在 白板 上 增加 了 “开发 自 测 ”一 
栏 ， 如 图 15-14 所 示 。 同 时 ， 也 定义 了 从 “开发 ”到 “开发 自 测 ”的 DoD， 即 重新 阅读 需求 
卡片 ， 确 保 需求 内 容 无 遗漏 。 “开发 自 测 ” 到 “测试 ”的 DoD 增 加 了 一 项 ， 即 逐条 查看 该 
需求 的 验收 条 件 ， 确 认 已 满足 它们 。 

















| 








15-14 将 “代码 评审 ”替换 成 “开发 自 测 ” 
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另外 , 由 于 上 次 对 代码 评审 工作 模式 的 调整 ,基本 在 两 个 小 时 之 内 就 可 以 完成 代码 评 
审 工作 。 因 此 ， 我 们 将 其 从 故事 墙 上 移 除了 ， 如 图 15-14 所 示 。 

7. 没有 反馈 ， 就 是 “风险 ” 

如 果 一 个 需求 的 开发 时 间 过 长 ,那么 通常 会 积累 很 多 代码 量 ， 一 次 性 代码 评审 的 工作 
量 大 , 代码 质量 也 无 法 保证 。 然 而 ,总 会 有 个 别 需求 无 法 拆 分 (强行 拆 分 可 能 也 无 法 验收 ， 
或 者 验收 成 本 过 高 )。 因 此 ， 团 队 约 定 了 一 个 弱 反 馈 方式 ， 即 每 个 大 需求 可 以 拆 分 成 多 个 
开发 任务 ， 虽 然 每 个 开发 任务 无 法 由 测试 人 员 进行 
验收 ， 但 是 可 以 通过 代码 评审 来 确定 其 完成 。 这 类 需 冰 多 号 : US_ we 






























需求 在 设计 阶段 就 会 被 分 拆 成 多 个 任务 ， 写 在 小 纸 、 
条 上 ， 附 在 需求 中 ， 如 图 15-15 所 示 。 任务 多 
8， 限 制 在 制品 数量 rr 





DDCCCBT 








随 着 项 目的 进展 ， 故 事 墙 上 又 出 现 了 “需求 堆 
限 ” 症 状 。 这 次 的 “堆积 ”发 生 在 “测试 状态 ” 。 系 
统 增 加 的 功能 越 来 越 多 ， 需 要 测试 的 回归 内 容 比 项 目前 期 要 多 。 另 外 ， 开 发 完成 后 ， 验 收 
出 来 的 缺陷 数量 也 有 所 增加 。 团 队 虽 然 可 以 在 比较 短 的 时 间 内 修复 这 些 缺 陷 , 但是， 团队 
只 有 一 名 测试 人 员 ， 来 不 及 验证 这 些 被 修复 的 缺陷 s 

怎么 办 呢 ?” 除 强调 开发 人 员 的 自 测 活动 ,增强 测试 用 例 的 完备 程度 以 外 ,团队 还 采用 
了 精益 管理 理论 中 的 “限制 在 制品 数量 ”策略 。“ 在 制品 ”(WIP) 这 个 概念 来 自 精 益生 产 
管理 理论 ， 它 是 指 尚 在 生产 流程 中 未 交付 的 半成品 。 在 精益 生产 体系 中 ， 库 存 分 为 原材料 
库存 、 在 制品 库存 、 成 品 库存 3 种 类 型 。 精 益生 产 管理 理论 认为 ， 库 存 不 增加 价值 ， 而 只 
增加 成 本 。 

在 每 日 站 会 时 ， 由 测试 人 员 评 估 一 下 ， 当 天 下 午 4 点 之 前 是 否 能 完成 测试 状态 下 所 有 
需求 的 测试 验收 。 如 果 能 够 完成 ， 那 么 一 切 工作 正常 进行 ， 如 果 无 法 完成 ， 技 术 组 长 会 
指定 当天 完成 需求 开发 的 开发 人 员 不 再 领取 新 的 需求 ,而 是 和 测试 人 员 一 起 工作 , 协助 其 
进行 需求 验收 工作 ， 直 至 测试 人 员 评 估 可 以 4 点 以 前 完成 所 有 需求 的 验收 工作 ， 如 图 15-16 
所 示 。 

这 就 相当 于 在 “测试 ”环节 ， 我 们 限定 了 最 高 带宽 ， 一 旦 超过 了 测试 人 员 的 生产 力 ， 
那么 就 停止 前 面 开发 环节 的 生产 , 扩大 “测试 ”环节 的 产能 , 参见 第 3 章 中 的 4 个 工作 原则 。 

到 此 为 止 , 团队 的 约定 可 以 基本 保证 所 有 的 用 户 需求 在 整个 研发 流程 中 平 背 流动 , 在 
每 个 环节 上 都 不 会 出 现 工 作 量 太 多 或 者 太 少 的 情况 。 

最 后 ， 总 结 一 下 团队 用 到 的 一 些 精益 理论 和 质量 管理 小 技法 。 

(1) 价值 流 映 射 Value Stream Mapping (故事 墙 是 “以 价值 为 核心 的 工作 流程 ”的 体现 )。 

(2) 减少 单位 工作 的 批量 大 小 (将 大 需求 拆 分 成 更 小 的 需求 )。 

(3) 持续 改进 (不 断 观察 工作 流程 ， 并 发 现 问 题 ， 改 进 工作 方式 )。 





图 15-15 带 有 多 个 任务 的 需求 卡片 
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(4) 限制 在 制品 的 数量 (测试 人 员 每 日 评估 产能 )。 
(5) 质量 内 建 ( 每 个 环节 都 定义 了 该 环节 的 完成 标准 ， 避 免 不 必要 的 任务 切换 )。 








| 








15-16 “增加 WIP 限 制 ， 限 制 开发 同时 扩大 测试 产能 
15.4.2 无 缺陷 交付 





项 目 并 没有 按照 团队 最 初 项 目 计划 正 常 进行 , 而 是 提前 在 第 10 个 迭代 成 功 交 付 了 所 有 
的 特性 开发 , 根本 没 使 用 预 留 的 两 个 缓冲 迭代 ， 如 图 15-17 所 示 。 从 图 中 可 以 看 出 ,实际 项 
目 执行 过 程 中 ， 需 求 范围 也 在 不 断 变化 〈 和 代 6、7、8 和 10)。 在 第 9 个 帮 代 时 ， 团 队 已 经 
完成 全 部 原 定 的 所 有 特性 。 当 该 新 产品 体验 的 总 负责 人 验收 时 ， 和 希望 再 增加 一 些 体验 优化 
功能 ， 因 此 在 第 10 个 返 代 又 完成 了 13 个 点 的 新 增 工 作 量 。 


1 原 需求 范围 
实际 需求 范围 - ~ 






120 


100 


~- 原 计划 
80 


1 2 3 4 5 6 Ed 8 9 10 I 12 
图 15-17 项 目 燃 烧 图 
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在 第 10 个 迭代 交付 后 ,团队 就 开始 忙于 其 他 项 目的 工作 了 。 而 对 这 个 新 型 移动 设备 的 
操作 系统 开发 来 说 ， 工 作 还 没有 结束 ， 还 有 几 个 重要 的 阶段 ， 它 们 是 集成 测试 、 系 统 测试 
和 外 场 测试 。 该 团队 的 交付 质量 非常 好 ， 后 续 各 阶段 都 没有 发 现任 何 缺陷 。 这 归功 于 项 目 
过 程 中 很 多 细致 的 改进 工作 。 


15.4.3 ”主干 开发 与 持续 集成 


图 15-17 中 的 前 3 个 迭代 的 开发 速度 远 远 低 于 团队 的 预期 。 这 是 由 于 团队 建立 团队 持续 
集成 服务 、 改 变 分 支 策 略 、 迁 移 代 码 版 本 管理 系统 等 工作 花费 比 预期 更 多 的 时 间 。 

对 于 百人 以 上 参与 的 项 目 开发 ， 代 码 仓库 的 分 支 策略 一 直 是 一 个 令 人 烦恼 的 问题 。 在 
这 类 持续 时 间 较 长 的 移动 设备 操作 系统 开发 中 ， 如 何 协调 这 么 多 人 的 代码 合并 操作 呢 ? N 
公司 采用 的 方式 为 团队 分 支 模式 ， 如 图 15-18 所 示 ,， 即 整个 新 产品 有 一 个 产品 主干 ， 而 每 一 
个 Scrum 团 队 在 开发 过 程 中 也 会 拉 取 一 个 分 支 。 团 队 代 码 合 入 主干 的 策略 是 ， 每 个 团队 在 
开发 完成 一 个 大 的 完整 功能 特性 集 后 ， 再 将 代码 合 入 主干 。 


GD 产品 试点 团队 
~ 持续 集成 -|'@ | 持续 集成 
`、 服 务 器 5 服务 


7 























产品 主干 > 
团队 1 的 分 支 
试点 团队 的 个 人 工作 区 > 





15-18 N 公 司 的 新 产品 项 目 分 支 策略 与 试点 团队 的 分 支 策略 


这 样 带 来 的 问题 是 : 虽然 在 产品 主干 上 架设 了 产品 级 的 持续 集成 服务 器 , 但 由 于 团队 
不 多 ， 合 和 频率 低 ， 因 此 每 日 的 持续 集成 构建 的 作用 有 限 。 团 队 通 常 是 在 自己 的 功能 特性 
开发 测试 完成 之 后 ， 决 定 合 人 主干 之 前 ， 才 将 主干 分 支 代 码 同步 到 自己 的 分 支 上 ， 因 此 每 
次 自己 分 支 及 产品 主干 上 的 代码 变更 集 都 会 比较 大 ， 一 次 合并 的 工作 量 非常 大 。 一 旦 某 个 
团队 合 入 后 ， 需 要 较 长 时 间 才 能 让 主干 的 代码 质量 稳定 下 来 。 

该 试点 团队 在 前 两 个 选 代 也 是 这 样 操作 。 团队 计划 在 自己 的 团队 分 支 上 建立 持续 集成 
服务 器 ,使 团队 内 部 成 员 的 代码 可 以 在 团队 分 支 上 进行 持续 集成 。 然 而 ， 负 责 架设 这 个 团 
队 持 续集 成 任务 的 开发 人 员 鼓 捣 了 很 入 ， 也 没 能 让 它 运 行 我 们 自己 的 单元 济 试 和 功能 测 
试 。 原 来 ， 让 单元 测试 运行 起 来 是 非常 容易 的 ， 但 是 ， 功 能 测试 却 很 困难 。 它 们 统一 由 另 
外 一 个 专门 的 自动 化 测试 团队 负责 开发 和 维护 ， 测 试 代码 放 在 哪里 , 需要 什么 环境 ,团队 
完全 不 知道 ， 必 须 找 专门 负责 的 那个 持续 集成 维护 团队 来 搞定 。 

在 这 期 间 , 我 们 有 功能 需要 向 产品 分 支 合 并 ,负责 合 入 的 开发 人 员 又 花费 了 很 长 时 间 
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来 搞定 。 另 外 ， 在 这 两 个 迭代 中 ，N 公 司 整 体 从 Synergy (一 种 代码 版 本 控制 系统 ) 切换 到 
Git， 对 团队 也 有 一 定 的 影响 。 这 些 因素 加 在 一 起 ， 使 我 们 前 3 个 迭代 的 交付 量 都 不 高 。 

团队 开发 人 员 提 出 ， 放 弃 团 队 分 支 ， 直接 使 用 产品 主干 开发 。 因 为 有 了 架构 隔离 ， 有 
了 自动 化 单元 测试 ， 需求 粒 度 也 拆 分 得 比较 细 ， 代 码 质量 可 控 。 同 时 ， 也 减少 了 一 次 从 团 
队 分 支 向 产品 主干 的 集中 合 入 操作 , 如 图 15-18 所 示 。 开发 人 员 在 每 次 向 产品 主干 提交 代码 
之 前 , 都 会 自动 运行 单元 测试 和 代码 扫描 , 这 样 , 团队 就 可 以 遵守 持续 集成 六 步 提 交 法 ( 参 
见 9.2 节 ) ， 及 时 得 到 质量 反馈 。 

值得 一 提 的 是 ， 在 研发 准备 期 ， 团 队 所 有 人 员 通 读 了 N 公 司 的 代码 规范 ， 并 且 让 团队 
成 员 提出 个 人 对 规范 的 疑惑 ， 共 同 讨 论 。 其 目标 是 要 求 团 队 成 员 了 解 并 遵守 规范 ， 并 在 持 
续集 成 服务 中 进行 代码 规范 扫描 。 

15.4.4 测试 活动 左 移 
我 们 在 第 13 章 中 ,简单 讨论 了 测试 活动 局 平 化 趋势 ， 并 指出， 对 于 那些 分 发 后 缺陷 修 
复 成 本 较 高 的 软件 ， 通 常 测试 活动 无 法 右 移 ， 只 能 “测试 左 移 " 。 而 本 案例 中 的 移动 设备 
软件 正 是 属于 这 种 类 型 。 因 此 ， 在 软件 交付 期 ， 我 们 将 很 多 测试 活动 左 移 。 
。 在 拆 分 需求 时 我 们 就 以 “能 够 验证 ”为 拆 分 标准 之 一 。 详 细 的 需要 拆 分 方法 和 原 
则 参见 第 6 章 的 相关 内 容 。 

。 每 个 需求 在 开始 编码 前 ， 测 试用 例会 提前 准备 好 ， 并 且 产 品 、 开 发 和 测试 共同 评 
审 ， 达 成 一 致 ， 做 到 了 调试 用 例 先 行 ， 在 第 一 时 间 明 确 软件 需求 质量 要 求 。 

e 开发 人 员 编 写 自动 化 单元 测试 ， 保 证 自己 的 代码 质量 。 

。 测试 人 员 在 每 个 用 户 故 事 开 发 完成 之 后 ， 就 立即 进行 验证 ， 而 不 会 像 以 前 那样 ， 
等 到 一 个 相对 比较 完整 的 功能 开发 完成 后 才 进 行 相关 功能 的 测试 。 

该 产品 由 C/C++ 编写 ， 因此， 在 项 目 开发 启动 前 ， 团 队 利用 一 个 下 午 的 时 间 ， 以 代码 
道场 (Code Dojo) 的 形式 ， 培 训 所 有 开发 人 员 如 何 使 用 CppUnit 框 架 以 及 如 何 编写 单元 测 
试 , 并 且 让 大 家 体验 了 以 测试 驱动 开发 方式 编写 产品 代码 。 在 实际 工作 中 ,对 TDD 并 没有 
要 求 ， 只 要 求 必须 编写 单元 测试 代码 。 

根据 该 项 目 代码 的 最 后 统计 结果 ， 产 品 代码 与 测试 代码 的 比 是 1:1.2， 即 每 100 行 产品 
代码 会 有 120 行 测试 代码 。 测 试 代码 中 包括 那些 自动 化 测试 脚手架 。 关 于 自动 化 测试 管理 
及 测试 脚手架 的 相关 内 容 参 见 第 10 章 。 


15.4.5 “代码 评审 


当 N 公 司 将 代码 版 本 控制 系统 从 IBM 的 Rational Synergy 切 换 到 了 Git， 且 提供 Gitflow 和 
code review 工 具 后 ,我 们 的 代码 评审 工作 流程 就 顺畅 很 多 ， 其 图 形 界 面 如 图 15-19 所 示 。 该 
工具 执行 过 程 如 下 。 
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歼 之 旅 





(1) 当 个 人 有 代码 提交 动作 时 ， 系 统 平台 会 自动 创建 一 个 临时 分 支 。 
(2) 在 这 个 分 支 上 会 有 一 系列 检验 ， 这 些 检验 全 部 通过 后 ， 才 会 真正 合 人 产品 主干 。 


这 些 检验 如 下 。 
e 自动 创建 的 自动 化 测试 
这 个 自动 化 测试 任务 的 














e 每 次 提交 的 代码 评审 得 分 必须 在 2 分 以 上 。 
e 内 容 检查 〈Content Check 是 内 部 术语 ) 必须 通过 。 


e 手工 测试 必须 通过 。 


























任务 (ROBOT task) 必须 执行 成 功 (我 们 也 要 求 负责 配置 
团队 将 我 们 团队 的 单元 测试 用 例 也 放 入 其 中 ), 这 相当 于 强 
制 执行 持续 集成 六 步 提交 法 的 第 4 步 ， 即 第 二 次 个 人 构建 验证 。 
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图 15-19 ”代码 提 





15.4.6 ”关注 结果 ， 更 要 关注 过 程 
在 N 公 司 引 入 Scrum 时 ， 非 常 关注 迭代 成 功 (Sprint Success) 。 常 听 到 一 些 使 用 Scrum 


框架 的 Scrum Master 在 迭代 总 结 会 
迭代 的 占 比 。 这 种 做 法 会 令 尚 不 成 熟 的 敏捷 





过 程 中 的 改进 。 





交 状 态 示 








上 说 :“ 这 次 迭代 我 们 失败 (failed) 了 。” 其 至 统计 失败 
团队 过 于 关注 迭代 速度 ， 而 忽略 了 在 项 目 执行 


在 我 们 的 试点 项 目 ， 特 意 弱化 了 “和 迭代 成 功 ”的 概念 ， 而 更 多 地 关注 工作 方式 与 方法 
的 改进 。 如 图 15-20 所 示 , 我 们 前 期 并 没有 按照 欠 代 计划 速度 完成 每 个 夺 代 , 但 这 也 不 影响 
我 圆满 地 完成 交付 任务 。 结 果 总 是 由 过 程 决 定 ， 因 此 还 是 让 团队 更 多 关注 过 程 ， 多 花 一 些 








时 间 在 过 程 的 改进 上 更 有 价值 。 
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35 


30 


1 2 3 4 5 6 7 8 9 10 11 


十 计划 速度 目 实 际 速度 
图 15-20 ” 友 代 速度 对 比 图 


(Ah 


15.5 小结 


由 于 N 公 司 的 移动 设备 软件 产品 线 已 经 按照 Scrum 框 架 组 织 运行 ， 其 架构 也 不 需要 整 
体 改动 ， 因 此 ， 我 们 主要 的 改善 活动 集中 于 持续 交付 七 巧 板 的 “基础 设施 ”部 分 。 通 过 团 
队 的 “业务 需求 协作 管理 ”， 分 别 拉动 “分 支 与 配置 管理 ”和 “构建 与 测试 管理 ”的 改善 ， 
如 图 15-21 所 示 。 








基础 设施 








文化 建设 














组 织 机 制 
图 15-21 ”持续 交付 七 巧 板 
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从 项 目 自 身 的 特点 来 说 , 虽然 都 是 在 一 个 百人 以 上 的 大 团队 中 做 产品 研发 改进 , 但 本 
案例 与 第 14 章 的 互联 网 产品 所 使 用 的 质量 保障 方式 有 明显 的 侧重 点 差异 。 由 于 该 移动 设备 
的 操作 系统 版 本 外 发 以 后 ， 如 果 质 量 不 合格 ， 其 召回 和 修复 成 本 非常 高 。 因 此 ， 更 多 地 使 
用 “测试 左 移 ” 方 式 ， 来 提升 发 布 前 的 质量 ， 以 降低 综合 成 本 。 因 此 ， 该 案例 在 团队 内 部 
开发 过 程 中 的 细节 工作 流程 上 做 了 比较 多 的 改进 ， 以 确保 软件 交付 质量 。 这 些 改进 项 对 比 
如 图 15-22 所 示 。 


























改进 前 改进 后 
任务 拆 分 人 故事 拆 分 
人 天 估算 > 排序 法 估算 
拍 脑袋 的 计划 人 基于 显 式 PRIAD 的 发 布 计划 
， 跟踪 个 人 的 任务 墙 人 关注 需求 流动 的 故事 墙 
。 强调 Sprint 的 成 功 人 弱化 Sprint 成 功 的 概念 
。 分 支 开发 > 主干 开发 
， 基 于 故事 的 代码 提交 ”> 基于 开发 任务 , 每 人 每 日 提交 
， 打 补丁 式 的 开发 人 通过 设计 ”分 离 关 注 点 
， 形 同 摆设 的 编码 规范 ”人 团队 认可 并 严格 遵循 的 编码 规范 
* 最 后 集成 测试 人 实时 测试 
* Synergy 人 GIT 
. > 单元 层次 的 集成 则 试 
> 单元 测试 





图 15-22 ”改进 项 的 前 后 对 比 


从 组 织 文 化 方面 来 说 ， 这 个 案例 的 特点 是 在 公司 大 环境 内 建立 团队 自 有 的 一 个 小 环 
绕 ， 并 在 其 中 建立 与 其 他 团队 不 同 的 质量 文化 。 这 种 方式 的 好 处 是 涉及 人 数 较 少 ， 影 响 可 








控 ， 容 易 产 生 比较 系统 化 的 改进 效果 。 同 时 ， 它 属于 大 项 目 中 的 一 个 子 团队 ， 可 以 与 其 他 
同样 的 团队 形成 鲜明 的 结果 对 比 ， 有 比较 大 的 示范 意义 ， 适 合作 为 整个 公司 敏捷 精益 转型 
项 目 启动 后 的 最 初 的 试点 ， 为 后 续 的 改进 提供 更 多 的 经 验 与 信心 。 
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E 见 ; 每 当 人 们 提起 DevOps 时 ， 总 会 联想 到 微服 务 、Docker 技 术 、Kubernetes 服 
务 编排 、 部 署 流 水 线 等 。 然而 ,《 敏 捷 软 件 开 发 的 组 织 模式 》 一 书 的 作者 James O. 
Coplien 在 GOTO2017 指 出 :“ 过 分 强调 并 专注 于 docker、Jenkins、 测 试 框架 、Mock 框 架 或 
者 持续 集成 服务 器 等 工具 ， 有 人 悖 于 敏捷 宣言 中 的 第 一 条 一 一 和 流程 与 工具 相 比 ,个 体 与 交 
互 更 为 重要 。” 工 具 可 以 让 很 多 重复 的 事情 变 得 简单 ， 但 并 不 能 解决 一 切 问 题 ， 人 与 人 之 
间 的 协作 更 为 重要 。 各 角色 协作 顺畅 ， 才 能 让 效率 提升 更 多 。 

本 案例 发 生 于 微服 务 概念 诞生 之 前 ，Docker 技 术 尚 未 成 熟 。 但 是 ， 团 队 应 用 “持续 交 
付 2.0” 理 念 ， 加 强 研 发 团队 与 运 维和 人员 的 协作 ， 经 过 4 个 月 的 改善 ， 在 保障 交付 质量 的 前 
提 下 ， 既 提高 交付 频率 近 6 倍 ， 对 和 需求 的 响应 速度 明显 加 快 ， 业 务 请 求 方 的 满意 度 大 幅 提 
高 ， 同 时 ， 在 测试 人 力 上 投入 也 减少 约 30%， 成 功 实施 了 一 次 向 DevOps 工 作 模 式 的 转变 。 

1. 案例 背景 

2010 年 前 后 ， 国 内 互联 网 行业 飞速 发 展 ， 敏 捷 开 发 方法 也 在 国内 软件 行业 扩展 开 来 。 
当时 B 公 司 的 组 织 架 构 如 图 16-1 所 示 。 测 试 人 员 隶 属于 大 测试 部 门 ， 运 维 人 员 隶 属于 大 运 
维 部 门 。 产 品 人 员 和 开发 人 员 均 隶属 于 各 条 业务 线 。 每 条 业务 产品 线 由 多 个 业务 部 门 组 成 ， 
每 个 业务 部 门 有 本 业务 产品 的 产品 人 员 和 开发 人 员 。 公 司 还 设 有 项 目 管理 部 (PMO)， 甚 
工作 内 容 主要 包括 以 下 3 部 分 。 
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图 16-1 B 公 司 的 组 织 结构 示意 图 
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(1) 研发 流程 工具 平台 管理 : 包括 项 目 管理 平台 、 公 司 代码 与 版 本 管理 平台 ， 以 及 需 
求 管理 工具 和 持续 集成 工具 。 

(2) 过 程 改进 组 ,负责 研究 并 引进 业界 先进 的 软件 项 目 管理 理念 , 并 在 公司 试点 推广 ， 
指导 公司 项 目的 过 程 改进 工作 ， 提 升 流 程 效 率 。 

(3) 知识 管理 ， 主 要 是 建设 用 于 知识 沉淀 的 支撑 平台 。 

本 案例 发 生 在 2011 年 B 公 司 某 业 务 线 下 的 一 个 后 台 服务 业务 团队 ， 这 个 团队 负责 网 页 
搜索 产品 的 后 台 服 务 〈 以 下 简称 为 S 服 务 ) ， 该 服务 是 一 个 相对 独立 的 子 系统 ， 其 架构 如 
图 16-2 所 示 。S 服 务 接受 其 他 服务 的 请 求 ， 也 将 自己 服务 的 处 理 结果 提供 给 其 他 服务 使 用 。 
它 由 7 个 程序 模块 组 成 ， 总 体 代码 量 约 为 10 万 行 ， 全 部 由 C/C+ + 语言 编写 ， 每 个 模块 都 是 
一 个 单独 的 进程 服务 (可 以 认为 是 微服 务 )， 运 行 在 近 300 台 服务 器 上 。 从 前 端的 数据 流 获 
取 开 始 ， 再 到 数据 流 的 解析 、 分 类 入 库 。 















































其 他 业务 服务 ， S 服 务 的 7 个 模块 








图 16-2 ”团队 负责 的 S 服 务 架构 示意 图 








2. 原 有 的 工作 模式 

B 公 司 所 有 软件 开发 都 是 以 项 目 制 进行 组 织 ， 一 个 项 目 可 能 是 一 个 很 大 的 功能 点 或 架 
构 改造 , 也 可 能 是 多 个 小 功能 的 集合 。 根 据 需求 规模 和 重要 程度 , 项 目 被 划分 为 4 级 , 即 A、 
B、C 和 D 级 。 一 个 D 级 项 目 可 能 一 个 开发 人 员 几 天 就 可 以 搞定 ， 而 一 个 A 级 项 目 可 能 会 历 
经 半年 ， 其 至 更 长 。D 级 项 目 通 常 直接 由 技术 人 员 直 接 负 责 即 可 。 而 规模 较 大 的 项 目 ， 也 
会 指定 产品 负责 人 和 测试 负责 

项 目 运作 模式 为 “分 支 开发 ， 集 中 联 调 、 集 中 提 测 ”。 在 分 支 开 发 和 集中 联 调 阶段 ， 
测试 人 员 参 与 较 少 ， 以 了 解 需求 为 主 ， 而 代码 分 支管 理 方式 如 图 16-3 所 示 ， 是 典型 的 “分 
支 开 发 、 主 干 发 布 ”模式 (这 种 模式 的 详细 介绍 参见 第 8 章 )。 

考虑 到 生产 环境 上 的 稳定 性 ， 运 维 部 门 规定 只 能 在 星期 二 和 星期 四 进行 上 线 部 署 操 
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作 ,， 并 且 每 次 只 能 上 线 一 个 项 目 。 因 为 项 目 分 支 较 多 ， 所 以 经 常 有 多 个 项 目 同时 在 项 目 开 
发 分 支 上 验证 完成 并 排队 等 待 合 入 发 布 分 支 的 情况 发 生 。 


项 目 A 上 线 点 
® 


项 目 A \ J 












项 目 B 上 线 点 
©O 






将 分 支 代码 合并 回 主干 







主干 代码 合并 到 特性 分 支 










创建 特性 B 分 支 每 次 提 测 都 
生成 3 位 版 本 号 联 调 点 ” 提 测 点 _ 生 成 4 位 版 本 号 

项 目 B OOOO=CGF 上 线 申 请 
! 开发 者 | 省 1， 开发 者 | 
! [说 细 设 计 ET 修复 缺陷 “|! 
| | ! 测试 人 员 。! 
| | 芭 EW 
和 











图 16-3 B 公 司 项 目 代码 分 支管 理 方式 


为 了 实现 S 服 务 的 新 架构 升级 ， 设 立 了 一 个 A 级 项 目 ， 预 计 需 要 3 个 月 的 时 间 。 在 这 个 
项 目 开 始 前 ， 除 4 名 开发 人 员外 ， 还 为 其 指派 了 两 名 测试 人 员 ， 他 们 隶属 于 大 测试 部 。S 
服务 是 一 个 后 台 技 术 服务 ， 并 没有 前 端的 UI 展 现 需求 ， 因 此 没有 安排 产品 经 理 ， 需 求 收集 
等 工作 由 开发 人 员 自 己 承担 。 


16.1 改进 的 关键 点 

本 市 我 们 重点 讲解 一 下 改进 的 关键 点 。 
16.1.1 改进 方法 论 

“目标 驱动 ， 从 简单 问题 开始 ， 持 续 改 善 ” 是 整个 改进 过 程 的 指导 思想 。 团 队 原来 使 
用 项 目 制 发 布 模式 (参见 第 8 章 )， 在 开发 联 调 和 和 集成 测试 阶段 ,软件 存在 的 问题 或 缺陷 才 
集中 爆发 。 这 些 问 题 不 仅仅 是 软件 质量 问题 ， 还 包括 需求 不 清晰 、 理 解 不 一 致 等 问题 ， 而 
它们 都 会 导致 项 目 完 成 时 间 的 不 确定 。 同 时 ， 生 产 线 上 的 突 发 问题 也 会 打 乱 项 目 节 奏 ， 为 
交付 时 间 增加 了 不 确定 性 。 

上 述 问 题 产 生 的 原因 与 其 研发 项 目 管理 理念 和 开发 方式 有 关 ， 需 要 在 项 目 运 作 方 式 、 
代码 分 支管 理 、 研 发 基础 设施 和 团队 成 员工 作 意 识 等 方面 做 出 改变 。 


16.1.2 定义 改进 目标 


每 个 角色 在 工作 过 程 中 都 有 一 些 痛 点 ,只 有 了 解 这 些 痛 点 ,才能 综合 评估 团队 的 现状 ， 
并 制订 合理 的 阶段 性 改进 目标 ， 同 时 也 可 以 找到 改进 的 路 径 。 
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架构 


1. 部 门 负责 人 的 期 望 

产品 部 门 负责 人 说 ,“ 从 项 目 管理 上 讲 ， 我 们 面临 的 一 个 大 问题 是 计划 性 非常 差 。 并 
不 是 我 们 不 做 计划 ， 而 是 经 常 有 各 种 各 样 的 情况 发 生 ， 总 会 让 项 目 变 得 不 太 可 控 。 例 如 ， 
组 的 项 目 通常 是 重要 大 项 目 ， 周 期 会 比较 长 ， 一 般 来 说 ， 研 发 周期 多 为 3 个 月 ， 其 中 
开发 阶段 占 两 个 月 ， 测 试 阶段 需要 一 个 月 。 但 这 只 是 平均 来 看 。 有 具体 到 每 个 项 目 ， 计 划 的 
不 可 控 性 非常 大 ， 交 付 日 期 经 常 有 变 。 例 如 ， 就 在 上 周 ， 我 们 刚刚 取消 了 一 个 项 目 K。 这 
个 项 目 投 入 30 人 月 的 时 间 , 但 是 总 是 因为 这 样 或 那样 的 原因 ， 述 迟 不 能 合 入 主干 上 线 ， 最 
终 因 为 时 机 和 环境 都 发 生 了 变化 ， 这 个 项 目 被 取消 了 ， 完 全 被 浪费 了 。 因 此 ， 我 的 期 望 并 
不 高 ， 能 帮助 我 让 这 个 周期 比较 长 的 A 级 项 目 交 付 时 间 可 预期 就 行 。” 

2. 团队 管理 者 的 交付 压力 





























团队 管理 者 说 :“ 首 先 ， 我 非常 希望 能 够 快速 交付 ， 但 我 们 对 这 类 架构 变动 类 的 项 目 


不 知道 怎么 能 做 到 ， 你 非常 有 经 验 ， 我 们 一 定 全 力 配 合 。 另 外 ， 我 们 虽然 在 这 个 项 目的 需 


求 范 


日 这 








围 和 交付 时 间 要 求 方面 可 以 有 一 定 的 灵活 性 , 但 是 其 中 有 一 部 分 需求 一 定 要 在 某 月 茶 





个 时 间 点 前 完成 。” 
3. 项 目 负责 人 的 烦恼 
与 开发 负责 人 和 测试 负责 人 沟通 以 后 ， 他 们 也 总 结 了 让 他 们 痛苦 的 事情 : 


。 估算 不 准确 、 





临时 插入 事情 多 、 项 目 计划 很 难 做 ， 


。 到 了 计划 的 测试 时 间 点 ， 开 发 人 员 还 没有 联 调 完 ， 无 包 可 测 ， 

。 当 有 软件 包 可 测 的 时 候 ， 测 试 人 员 却 被 调 去 测试 其 他 项 目 了 ， 

。 好 不 容易 有 测试 人 员 了 ， 一 测试 就 发 现 很 多 低级 问题 ， 可 能 都 局 动 不 了 ， 
。 没 法 继续 测 下 去 ， 还 要 打 回 给 开发 ， 继 续 修复 ， 

。 测试 环境 和 测试 数据 的 准备 要 耗费 很 长 时 间 ， 

。 测试 时 需要 将 线 上 环境 的 一 些 配置 同步 下 来 ， 因 为 那 才 是 最 可 靠 的 环境 ， 
e。 反 反 复 复 提 测 好 几 次 ， 手 工 重复 测试 真是 受 不 了 ， 

e 终于 可 以 准备 上 线 发 布 了 ， 还 要 排队 等 待 ， 

。 当 轮 到 自己 的 项 目 上 线 了 ， 还 要 把 前 面 已 经 上 线 的 代码 拉 取 合并 ， 再 测试 ， 














假如 前 面 上 线 项 目 出 了 问题 要 回 滚 ， 我 们 还 要 把 代码 剥离 出 去 ， 再 打包 ， 再 测试 ; 
写 了 一 大 堆 上 线 文档 ， 交 给 运 维 人 员 ， 运 维 人 员 说 不 符合 运 维 规范 ， 要 重新 修改 ; 
运 维 人 员 终于 可 以 部 署 了 。 可 是 ， 刚 部 署 上 去 ， 就 出 问题 ， 原 来 是 把 配置 文件 搞 
错 了 ; 





经 过 调研 与 讨论 , 团队 各 级 管理 者 一 起 定义 了 这 个 项 目的 改进 目标 , 并 在 项 目 启动 会 上 ， 








向 所 有 干系 人 解释 和 说 明 。 目 标 包括 短期 目标 和 中 期 目标 。 短期 目标 如 下 , 优先 级 由 高 到 低 。 


(1) 项 目 近 预期 时 间 交 付 。 
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(2) 创建 新 的 软件 研发 协作 方式 。 

(3) 建立 必要 的 基础 设施 ， 以 支持 后 续 的 持续 发 布 模式 。 

中 期 目标 如 下 。 

(1) 缩短 发 布 周期 ， 可 以 快速 上 线 。 

(2) 不 降低 生产 环境 的 质量 。 

(3) 降低 测试 人 力 总 投入 。 

这 两 个 目标 分 别 对 应 两 个 实施 阶段 。 第 一 阶段 是 以 持续 集成 牵引 的 “敏捷 101”， 顺 利 
完成 一 次 发 布 , 并 为 后 续 的 持续 发 布 英 定 流程 与 工具 基础 。 第 二 阶段 是 向 DevOps 工 作 模式 
转型 的 持续 发 布 之 旅 。 


16.2 第 一 阶段 : 敏捷 101 


“敏捷 101” 模 式 也 被 称 为 “Water-Scrum-fall” 模 式 ， 是 指 在 瀑布 开发 框架 模式 下 ， 对 
各 个 阶段 内 部 进行 迭代 时 间 盒 的 划分 ， 迭代 周期 通常 是 1 ~4 周 。 其 中 ， 开 发 阶段 中 的 每 个 
和 迭代 周期 内 ， 都 会 发 生 需 求 分 析 、 代 码 开 发 和 测试 活动 。 而 且 , 要 在 每 个 开发 迭代 结束 时 ， 




















做 演示 验收 。 但 是 ， 在 进入 开发 阶段 前 ,仍旧 有 需求 收集 、 分 析 和 计划 的 阶段 ， 并 且 在 开 
发 阶段 结束 之 后 ， 也 会 安排 一 到 两 个 迭代 ， 作 为 最 后 的 系统 测试 还 代 。 最 后 可 能 会 安排 系 
统 试 运行 阶段 ， 然 后 再 正式 上 线 ， 如 图 16-4 所 示 。 
需求 分 析 与 计划 开发 阶段 测试 阶段 试 运行 上 线 发 布 
| 
开发 :|| 集成 测试 
1 1 测 试 1 1 1 1 





迭代 1 ”迭代 2 和 迭代? 迁 代 mt+1 迭代 n+2 
图 16-4 ”敏捷 101 模 式 


敏捷 101 模 式 的 特点 是 : 瀑布 开发 模式 中 的 儿 大 阶段 没有 变化 ， 只 对 各 个 阶段 内 部 的 
活动 进行 适当 调整 。 此 模式 通常 应 用 于 对 持续 交付 理解 不 深 、 研 发 基础 设施 不 完备 ， 但 希 
望 进行 改进 的 团队 。 

在 这 个 团队 中 使 用 这 种 模式 ， 一 是 为 了 未 来 能 够 实现 “ 城 际 快 线 ”模式 做 能 力 储备 ， 
二 是 为 了 培养 团队 人 员 的 质量 意识 和 良好 的 团队 协作 习惯 。 


16.2.1 做 个 靠 谱 的 计划 


首先 ,我 们 要 回答 的 问题 是 :“ 这 个 项 目 什么 时 候 能 够 做 完 上 线 ? “此 时 ， 开 发 负责 人 
已 经 拿 到 了 这 个 项 目的 需求 ,并 根据 以 往 的 工作 经 验 , 做 了 一 些 需 求 分 析 工 作 和 概要 设计 
工作 。 然 而 ， 这 是 一 个 研发 工作 量 较 大 、 交 付 周期 较 长 的 项 目 ， 因 此 ， 我 们 决定 采用 新 的 
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需求 分 析 、 估 算 和 制订 项 目 计划 的 方法 ， 来 进一步 完善 项 目 计 划 。 

1. 需求 拆 分 

如 果 按 照 过 去 的 项 目 做 法 , 现在 团队 就 已 经 开始 启动 代码 开发 工作 了 。 然 而 ,我 坚持 
要 求 对 需求 进一步 分 解 ， 并 且 邀 请 测试 人 员 参 加 需求 拆 分 。 这 种 拆 分 并 非 一定 要 在 会 议 室 
中 进行 。 在 这 个 项 目 中 ， 开 发 负责 人 自己 根据 下 面 的 3 个 要 求 进 行 了 一 轮 拆 分 ， 并 交 给 测 
试 负责 人 评审 。 测 试 负 责 人 对 拆 分 列表 进行 线 下 评审 和 补充 后 ， 再 与 开发 负责 人 讨论 ， 形 
成 一 致意 见 。 

(1) 每 个 需求 实现 少 于 3 天 。 在 这 次 试点 中 ， 为 了 能 够 尽早 地 了 解 我 们 所 写 代 码 的 质 
量 ， 及 早 发 现代 码 中 存在 的 缺陷 ， 我 们 把 所 有 的 需求 折 分 成 细 粒 度 需求 ， 每 个 需求 的 实现 
时 间 估 计 在 半天 到 两 天 之 间 。 这 样 ， 每 当 开发 完 一 个 需求 后 ， 测 试 人 员 就 对 其 进行 测试 。 
如 果 存 在 问题 ， 就 可 以 尽早 发 现 了 。 

(2) 拆 分 要 遵循 INVEST 原 则 。 拆 分 的 基本 原则 就 是 INVEST, 即 独立 的 (Independent)、 
可 协商 的 Negotiable)、 有 价值 的 (Valuable)、 可 估算 的 (Estimatable)、 较 小 的 (Small) 
和 可 测试 的 (Testable)。 具 体 方法 参见 第 6 章 。 

(3) 拆 分 过 程 中 的 权衡 。 在 刚刚 开始 学 习 拆 分 时 ， 团 队 遇 到 了 问题 ， 即 觉得 拆 分 后 无 
法 同时 满足 这 6 个 原则 。 例 如 ,“ 有 一 些 比较 大 的 需求 区 如 果 拆 分 成 小 的 需求 ， 产 品 人 员 或 
测试 人 员 好 像 就 无 法 完整 验收 了 ， 因 此 没有 拆 分 。” 

事实 上 ， 的 确 会 遇 到 个 别 需 求 在 完整 开发 完成 之 前 ， 无 法 在 用 户 界面 验收 的 情况 。 但 
是 ， 假 如 我 们 能 把 它 拆 成 小 需求 ， 同 时 测试 人 员 能 够 找到 一 些 方式 验证 其 运行 的 正确 性 也 
是 可 以 的 , 如 直接 查看 日 志 或 数据 库 中 的 结果 。 虽然 从 用 户 的 角度 看 , 该 功能 还 无 法 交付 ， 
上 昌 是 ， 我 们 可 以 尽早 测试 每 一 个 小 需求 ， 以 得 到 更 早 的 质量 反馈 ， 确 保 其 实现 的 正确 性 。 
但 一 定 要 记 住 ， 这 种 需求 数量 不 应 该 太 多 。 

假如 这 6 个 原则 一 定 要 分 先后 的 话 , 在 将 需求 拆 分 到 更 细 粒 度 时 , 后 面 3 个 原则 (EST) 
要 优先 于 前 面 3 个 原则 (INV)。 

2. 相对 估算 

我 们 得 到 了 开发 人 员 和 测试 人 员 都 理解 的 需求 列表 , 并 对 每 个 细 粒 度 需求 的 验收 条 件 
达成 了 一 致 。 接 下 来 就 是 工作 量 估算 步骤 了 。 我 们 使 用 排序 法 对 需求 进行 估算 〈 详 细 的 操 
作 方 法 参见 附录 B)。 这 种 排序 法 有 2 个 主张 和 4 个 前 提 。 

2 个 主张 具体 如 下 。 

(1) 与 传统 的 相对 估算 方法 相 比 ,这 种 方法 将 较 多 的 需求 放 在 一 起 比较 时 , 结合 上 下 
文 ， 更 容易 估算 ， 而 且 能 够 降低 因 人 员 能 力 差 异 带 来 的 估算 偏差 。 

(2) 尽管 单个 需求 自身 规模 并 不 一 定 准 确 , 但 在 需求 数量 较 多 时 ,项目 整体 规模 估计 
会 相对 准确 。 

4 个 前 提 具 体 如 下 。 
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(1) 每 个 需求 至 少 有 两 个 人 比较 了 解 ， 且 可 以 完成 (所 需 的 时 间 长 短 可 能 不 同 )。 

(2) 不 需要 评估 测试 活动 的 工作 量 。 其 原因 在 于 ,我 们 假设 测试 不 是 流程 瓶颈 能够 
及 时 完成 测试 ， 而 开发 环 市 才 是 整个 系统 的 瓶 开 。 如 果 测 试 环 市 成 为 流程 瓶颈 的 话 ， 我 们 
其 至 可 以 认为 “开发 资源 投入 过 多 ”。 

(3) 所 有 需求 已 被 分 解 ， 其 规模 大 小 不 会 相差 太 大 。 

(4) 需求 的 个 数 相对 较 多 。 

经 过 估算 ,我 们 整个 项 目的 总 体 工作 量规 模 为 66 个 点 。 有 了 时候， 估算 会 出 现 相 对 工作 
量 为 “0” 的 现象 。 这 是 因为 它 的 工作 量 相对 来 说 ， 实 在 太 小 。 当 时 处 理 这 种 情况 的 方式 
是 ,将 儿 个 “0” 点 需求 合计 为 1 点 。 注 意 不 是 需求 合并 , 只 是 工作 量 估算 相 加 , 即 “0+0+0+… 
+0-1”。 

3. 初始 计划 

现在 , 我 们 虽然 知道 了 规模 ,但 还 是 无 法 知道 项 目 完成 的 时 间 点 。 现 在 我 们 需要 知道 
团队 的 产能 才能 做 计划 。 而 要 想 知 道 团队 的 产能 ， 我 们 必须 回答 下 面 儿 个 问题 。 

(1) 理想 情况 下 ， 团 队 每 周 工作 时 间 是 多 少 ? 

假设 每 个 人 每 天 工作 8 小 时 ， 减 去 每 周 架构 组 的 团队 例会 需要 1 小 时 ， 再 减 去 我 们 项 
目 组 每 天 早上 10 分 钟 的 站 会 ， 再 减 去 每 天 未 工作 时 间 (我 们 按 每 天 2 小 时 计算 ， 谁 能 每 天 8 
小 时 都 在 工作 呢 )， 那 么 ， 团 队 实 际 在 一 周 内 每 人 的 生产 时 间 为 28 小 时 ， 即 每 人 每 天 大 约 
可 以 有 5.5 小 时 的 开发 工作 。 

(2) 理想 情况 下 ， 每 周 能 完成 多 少 需求 ? 

接 下 来 引导 开发 人 员 进 行 每 周 开发 速度 的 估计 。 我 把 所 有 的 需求 都 打印 到 了 纸 上 , 每 
张 纸 上 有 一 个 需求 。 规 则 是 这 样 的 : 我 会 拿 出 一 些 需 求 ， 给 大 家 展示 。 作 为 一 个 整体 ， 如 
果 团 队 认 为 可 以 完成 ， 就 说 “能 ”， 如 果 无 法 完成 ， 就 说 “不 能 "。 在 开始 估算 之 前 ， 提 醒 
团队 : 每 人 每 天 只 有 5.5 小 时 的 生产 时 间 。 

我 拿 出 了 第 一 个 需求 ， 大 家 点 头 。 我 拿 出 第 二 个 需求 ， 问 道 :“ 加 上 这 个 需求 ,一 周 
内 能 完成 吗 ? ”大 家 仍旧 点 头 。 当 我 拿 出 第 五 个 需求 的 时 间 ， 大 家 开始 摇头 。 于 是 我 从 桌 
面 上 拿 回 了 一 个 需求 ， 又 放 上 一 个 需求 ， 问 道 :“ 现 在 呢 ? ”大 家 又 点 头 了 。 我 又 加 了 一 
个 需求 ， 大 家 仍旧 点 头 。 于 是 我 再 加 了 一 个 需求 ， 大 家 就 摇头 了 。 于 是 我 把 桌面 上 除 最 后 
一 个 需求 外 的 所 有 需求 都 标记 了 一 下 ， 并 收 好 ， 作 为 一 组 。 又 换 了 一 组 需求 ， 过 程 不 变 ， 
再 进行 一 次 。 最 后 把 第 二 次 桌面 上 的 所 有 需求 也 收 在 一 起 ， 作 为 第 二 组 。 

此 时 ， 将 每 组 需求 的 点 数 求 和 ， 并 对 两 组 的 结果 做 对 比 ， 相 差 不 大 ， 平 均 点 数 为 22。 
那么 不 算 后 面 的 集成 测试 阶段 的 话 ， 理论 上 只 要 3 周 的 时 间 ， 团 队 就 能 开发 完成 这 个 项 目 。 

(3) 实际 每 周 最 有 可 能 开发 完成 多 少 需求 ? 

互联 网 每 天 有 很 多 线 上 问题 要 处 理 ( 线 上 异常 监控 与 诊断 、 紧 急 的 hotfix、 与 其 他 团 
队 的 临时 沟通 )， 也 会 花 去 一 些 时 间 。 评 估 一 下 ， 处 理 不 属于 该 项 目的 事务 ， 平 均 每 天 大 
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约会 占用 团队 多 长 时 间 ? 该 项 目的 结论 是 : 两 个 资深 入 员 是 大 约 50%， 另 外 两 个 开发 人 员 
是 大 约 30%。 我 们 就 算 团 队 有 40% 时 间 在 忙 其 他 的 事务 。 

另外， 我 们 不 可 能 剩余 时 间 都 做 开发 工作 ， 可 能 还 需要 一 部 分 时 间 用 于 交流 ， 例 如 ， 
和 测试 人 员 讨 论 需 求 细 市 、 确 认 验 收 用 例 等 。 这 可 能 会 占 去 我 们 10% 的 时 间 。 这 么 算 下 来 ， 
开发 人 员 还 有 50% 的 时 间 可 用 。 因 此 ， 每 周 可 以 完成 11 个 点 的 需求 (22 x 50%=11)， 那 么 
迄 代 开 发 需要 6 周 (66 二 11=6)。 

我 们 要 求 在 迭代 开发 过 程 中 ,测试 人 员 会 做 增 量 测试 ， 即 一 旦 有 需求 开发 完成 ,立即 
进行 测试 。 测 试 中 如 果 发 现 癌 题 ， 要 求 开 发 人 员 立 即 着 手 修复 。 因 此 ， 开 发 速度 可 能 要 比 
刚才 的 估计 慢 一 些 ， 因 此 ， 我 们 先 按 6.5 周 开发 时 间 来 计算 。 

(4) 如 何 处 理 整 个 项 目 开发 过 程 中 的 线 上 需求 变更 ? 

这 是 团队 第 一 次 使 用 这 种 迭代 开发 方式 ， 还 无 法 达到 持续 交付 的 状态 ， 因 此 分 支 方式 
并 没有 改变 ， 仍 旧 如 图 16-5 所 示 ， 是 在 发 布 主干 上 拉 一 条 项 目 开 发 分 支 ， 所 有 人 基于 这 个 
分 支 进 行 开 发 。 对 于 临时 的 紧急 需求 ， 在 线 上 发 布 版 本 分 支 上 单独 拉 分 支 ， 快速 修复 线 上 
问题 或 开发 紧急 需求 ， 快 速 合 并 上 线 的 策略 。 

线 上 发 布 版 本 分 支 紧急 需求 紧急 缺陷 修改 紧 名 俱 隐 修改 





















新 项 目 开发 分 支 O 
新 的 线 上 发 布 版 本 分 支 





图 16-5 ”敏捷 101 时 采用 的 项 目 主干 开发 策略 


但 是 ， 所 有 这 些 新 增 的 需求 或 缺陷 修改 ,要 一 并 记录 到 本 项 目的 需求 列表 当中 ,并 根 
据 实际 情况 , 合并 到 新 项 目 开发 分 文 。 因 有 架构 改变 , 有 一 部 分 紧急 需求 的 代码 无 法 合并 ， 
只 能 在 新 项 目 开发 分 支 上 重新 再 实现 一 次 。 因 此 ， 我 们 预 留 3 天 的 时 间 实 现 这 部 分 遗留 线 
上 需求 。 

至 此 ， 开 发 阶段 的 总 时 间 预 计 为 7 周 。 

(5) 系统 测试 的 时 间 在 哪里 ? 

测试 人 员 提 出 了 一 个 疑问 :“7 周 是 需求 开发 完成 的 时 间 。 最 后 那个 迭代 最 后 一 天 开发 
完 的 需求 也 需要 测试 。 另 外 ， 在 此 之 后 ， 还 需要 做 整个 系统 的 完整 测试 。 原 来 这 部 分 系统 
测试 的 时 间 要 一 个 月 。 那 现在 系统 集成 测试 需要 多 长 时 间 呢 ? ” 

以 前 是 传统 开发 方法 ， 因 此 ， 提 测 时 间 比 较 靠 后 ， 需 要 测试 的 内 容 比 较 多 。 除 了 功能 
测试 ， 还 包含 性 能 、 压 力 和 稳定 性 。 花 费 最 长 时 间 的 是 “大 环 测 试 ”( 大 环 测试 可 以 认为 
是 与 生产 环境 最 相似 的 测试 环境 , 使 用 真实 且 实 时 的 数据 ， 只 是 处 理 结果 并 不 进入 生产 库 
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保存 而 已 ) 。 按 惯例 ， 通 常 需 要 两 周 时 间 ， 最 少 也 要 一 周 。 这 期 间 也 会 有 一 些小 修 小 补 。 
大 环 测试 主要 是 对 实际 数据 进行 部 分 引流 ， 观察 有 无 异常 情况 发 生 。 如 果 有 异常 ， 需 要 再 
分 析 解 决 。 

我 们 现在 使 用 “ 返 代 开发 ， 并 且 每 个 需求 完成 就 进行 集成 测试 ， 通 常 这 会 大 大 减少 
在 后 期 测试 阶段 发 现 缺 陷 的 数量 。 另 外 ， 只 要 做 到 每 次 需求 开发 完成 就 立即 测试 ， 那 么 最 
后 一 个 开发 迭代 结束 时 ， 刚 开发 完成 未 经 过 测试 的 需求 数量 应 该 不 会 太 多 ,这儿 个 需求 的 
测试 时 间 应 该 很 短 。 因 此 ， 我 们 把 集成 测试 阶段 暂 定 为 2 周 的 时 间 。 

(6) 其 他 类 型 的 测试 〈 如 性 能 测试 和 压力 测试 ) 怎么 办 ? 

对 于 性 能 测试 ， 我 们 每 周 做 一 次 ， 得 到 结果 数据 。 如 果 发 布 有 问题 ， 马 上 诊断 修复 。 
这 样 做 ， 质 量 反馈 会 很 快 。 

按照 目前 的 逻辑 ， 整 个 项 目 从 开发 迭代 预计 需要 7 周 ， 系 统 测 试 预 计 和 需要 2 周 ， 那 么 整 
个 项 目 完成 大 约 为 9 周 。 

(7) 计划 时 还 需要 考虑 依赖 因素 ? 

在 业务 和 技术 两 个 方面 , 我 们 这 个 项 目 与 其 他 团队 是 否 还 有 依赖 关系 ?事实 上 , 的 确 
存在 一 些 业务 上 的 依赖 。 我 们 项 目 要 在 另 一 个 项 目 上 线 之 后 ， 才 能 上 线 。 不 过 ， 被 依赖 的 
项 目 进度 比 我 们 自己 的 快 ， 因 此 应 该 不 会 成 为 问题 。 

在 这 个 计划 估计 中 ,我们 还 没有 考虑 到 个 人 事假 和 生病 、 集 体 活动 和 法 定 假日 。 如 果 
算 上 这 些 ， 可 能 要 接近 9.5 周 。 

(8) 项 目 计 划 在 整体 上 要 加 一 个 缓冲 时 间 ， 更 符合 实际 ? 

计划 结束 后 ,我 和 团队 管理 者 进行 了 沟通 。 这 个 项 目 计划 是 没有 考虑 任何 异常 情况 发 
生 , 并 且 还 包含 多 个 假设 条 件 。 例 如 ， 全力 开 发 速度 是 22 个 点 / 周 ; 被 其 他 非 本 项 目的 事务 
打扰 ， 占 用 40%， 整个 团队 只 有 3 天 时 间 被 非 工作 事务 占用 (法 定 假期 、 团 队 活动 和 团队 临 
时 休假 )。 

这 3 个 主要 假设 都 有 可 能 不 成 立 ， 需 要 密切 关注 。 也 许 在 这 个 项 目的 整体 周期 上 ， 再 
加 入 一 个 为 期 “两 周 ” 的 缓冲 时 间 更 合适 。 在 项 目 进行 过 程 中 ， 可 以 通过 这 个 缓冲 时 间 的 
消耗 来 作为 项 目 风险 的 转化 指示 器 。 

制订 计划 时 需要 考虑 PARID 因 素 , 即 优先 级 (priority) .假设 (asssumption) .风险 (risk)、 
问题 (issue) 和 依赖 (dependency ) 。 

16.2.2 开发 阶段 启 航 

项 目 计 划 制 订 后 ， 团 队 就 要 启动 运 代 开 发 工作 了 。 第 一 步 就 是 确定 迭代 周期 ， 并 约定 
团队 的 协作 流程 。 

1. 迭代 周期 的 选择 

在 确定 迭代 周期 之 前 ， 让 我 们 先 来 了 解 一 个 隐喻 。 如 图 16-6 所 示 ， 当 湖面 很 高 时 ， 湖 
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中 的 石 块 都 被 水 所 覆盖 ， 此 时 即使 有 很 大 的 岩石 ， 人 们 也 看 不 到 。 但 是 当 水 量 减 少 ,水 面 
降低 时 ， 一 些 大 石 块 就 暴露 出 来 了 。 接 下 来 随 着 湖面 的 进一步 降低 ， 更 小 的 石 块 也 会 逐步 
被 人 们 发 现 。 如 果 把 水 面 的 高 度 看 作 是 每 个 迭代 的 时 间 ， 那 么 ,水 中 的 岩石 就 可 以 看 作 是 
日 常 工作 中 存在 的 问题 。 








图 16-6 ”湖水 与 岩石 


假如 用 传统 方式 开发 软件 ， 这 个 时 间 盒 是 3 个 月 ， 水 位 很 高 ， 日 常 工作 中 存在 的 问题 
(也 就 是 岩石 ) 很 难 暴露 出 来 。 当 我 们 使 用 迭代 开发 模式 后 ， 交 付 时 间 盒 变 短 ， 也 相当 于 
水 位 下 降 ， 问 题 就 很 容易 暴露 出 来 。 

至 于 水 位 到 底 选 择 多 高 合适 ， 需 要 根据 团队 的 其 体 情 况 而 定 。 因 为 水 位 越 低 ， 给 团队 
带 来 的 不 舒适 感 越 强 ， 越 容易 有 挫败 感 。 但 如 果 水 位 太 高 ， 问 题 不 容易 暴露 ， 改 进 动力 不 
足 ， 团 队 的 行为 惯性 导致 改进 缓慢 ， 较 难看 出 变化 。 

为 了 保险 起 见 ，S 服 务 团队 选择 两 周作 为 一 个 迭代 周期 。 事 实 上 ， 这 个 和 迭代 周期 仅 是 
用 来 做 周期 性 的 工作 量 计划 与 团队 的 总 结 回顾 会 议 ， 因 为 我 们 要 求 尽 可 能 保持 每 次 提交 代 
码 都 能 够 得 到 可 运行 的 软件 ， 这 也 对 团队 的 协作 流程 提出 了 更 高 的 要 求 。 

2. 团队 协作 流程 

既然 需要 每 次 提交 代码 都 能 够 得 到 可 运行 的 软件 , 就 需要 团队 各 角色 之 间 对 协作 流程 
以 及 流程 中 每 种 工作 活动 的 质量 及 交付 物 有 更 高 的 要 求 。 

(1) 每 个 迭代 的 工作 约定 

一 个 友好 的 氛围 不 一 定 会 产生 一 个 高 效 的 团队 , 但 达成 共识 一 定 是 一 个 富有 战斗 力 团 
队 的 基石 。 在 一 个 迭代 里 ， 团 队 成 员 怎么 配合 呢 ? 在 项 目 估算 与 计划 会 议 结束 后 ， 我 为 大 
家 介绍 了 每 个 途 代 的 开发 过 程 ， 并 进行 了 讨论 ， 共 同 制订 了 迭代 工作 疲 程 ， 其 部 分 规则 如 
下 所 示 : 

。 每 天 上 午 10:00 进 行 晨 会 ， 

。 每 个 迭代 的 最 后 一 个 周 五 下 午 ， 花 一 小 时 做 团队 回顾 和 下 一 个 迭代 的 开发 计划 ， 

e 每 个 欠 代 计划 中 包含 开发 完成 计划 和 测试 完成 计划 ( 即 一 共 可 以 开发 完成 多 少 点 

需求 ， 可 以 测试 完成 多 少 需求 ) 
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e 以 开发 速度 做 计划 ， 以 验证 完成 无 缺陷 为 测试 速度 来 检验 我 们 的 迭代 计划 ， 

。 不 对 已 估算 的 需求 进行 再 次 估算 ; 

。 对 于 新 增 需 求 ， 需 要 进行 估算 。 

(2) 对 于 单个 需求 的 开发 流程 约定 

原 有 的 开发 流程 是 批量 开发 ， 批 量 提 调 ， 而 在 新 的 迭代 开发 方式 ， 我 们 使 用 单个 需求 
开发 ， 开 发 完成 后 立即 提 测 的 方式 ， 如 图 16-7 所 示 。 





分 析 设 计 、 
验收 条 件 本 地 调试 CI 通 
达成 共识 ”开发 ”自动 化 测试 ”本 地 演示 ”提交 代码 ” 过 各 级 测试 





时 间 线 
关 / 2 六 2 站 
自动 化 用 例 简单 验收 。 提交 自动 化 手工 测试 | 
准备 与 调试 | 测试 用 例 
在 测试 机 进行 
自动 化 用 例 调试 
未 统 测 这 
Bats | i 
开发 人 员 的 活动 测试 人 员 的 活动 环境 
































图 16-7 一 个 需求 (用户 故事 ) 的 生命 周期 


“批量 开发 ， 批 量 提 测 ” 是 指 开发 人 员 等 到 全 部 或 大 部 分 功能 开发 完成 后 ， 再 一 起 联 
调 。 联 调 通 过 后 ， 再 一 起 提交 给 测试 人 员 进 行 大 规模 测试 。“ 单 例 开 发 ， 即 时 提 测 ”是 指 
每 当 开发 人 员 开 发 完 一 个 需求 之 后 ， 就 立即 交 给 测试 人 员 进 行 验证 。 这 种 方式 也 引发 了 开 
发 人 员 和 测试 人 员 的 一 些 疑 问 : 

e 明明 知道 后 面 还 有 一 个 需求 与 当前 开发 的 需求 需要 修改 同一 份 代码 ， 为 什么 我 不 

能 一 气 呵 成 写 完 呢 ? 
。 我 的 习惯 是 先 写 出 一 个 大 概 的 实现 框架 ， 然 后 再 添加 功能 ， 这 样 不 是 开发 效率 更 
高 吗 ? 

e 一 个 大 功能 分 开 实现 ， 那 就 意味 着 我 的 工作 要 重复 很 多 次 吗 ? 

这 3 个 疑问 恰好 反映 了 “大 规模 生产 ”和 “小 批量 交付 ”两 种 方式 关注 焦点 的 不 同 。 
传统 软件 开发 模式 属于 前 一 种 方式 ， 更 强调 每 个 加 工 环节 的 效率 ， 并 且 其 前 提 假 设 是 : 每 
个 环节 的 正品 率 都 很 高 ， 甚 至 根本 不 会 出 错 。 然 而 ， 对 软件 开发 工作 来 说 ， 这 个 前 提 假 设 
基本 不 成 立 。 测 试 作为 后 续 环 节 ， 其 大 规模 检查 常常 会 导致 3 种 情况 。 

(1) 有 可 能 存在 需求 考虑 不 充分 的 情况 。 

(2) 后 期 集成 时 发 现 的 缺陷 数量 较 多 。 
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(3) 缺陷 修复 不 及 时 ， 最 终 导致 测试 交付 日 期 不 可 预期 。 

和 迭代 开发 属于 小 批量 交付 ， 遵 循 的 质量 原则 是 :“ 停 止 靠 检查 来 提高 质量 。 取 消 大 规 
模 检 查 ， 而 代 之 以 在 生产 流程 的 第 一 时 间 就 建立 质量 保证 。” 这 个 原则 来 自 戴 明 14 条 质量 
原则 的 第 三 条 “质量 内 建 ”(built quality in) 原则 。 那 么 ， 如 何 来 约束 每 一 个 活动 的 过 程 
质量 呢 ? 


16.2.3 ”对 过 程 质量 的 约束 


由 于 需求 粒度 较 细 (通常 在 两 天 以 内 )， 需 找到 有 效 方 式 ， 用 尽 可 能 低 的 成 本 尽 可 能 
早 地 发 现 问 题 。 于 是 我 们 在 团队 里 引入 了 持续 集成 实践 。 在 本 项 目 开 始 之 前 ，B 公 司 已 经 
开始 引入 “持续 集成 ”的 概念 ， 但 是 本 团队 对 它 的 理解 就 是 在 最 后 提 测 阶段 有 一 个 自动 打 
包 上 传 的 工具 ， 完 全 与 自己 的 开发 活动 没有 关系 。 然 而 ， 真正 的 持续 集成 实践 是 一 项 开发 
人 员 和 测试 人 员 每 天 都 要 参与 的 协作 活动 ,需要 所 有 人 员 遵 守 持 续 交 付 六 步 提 交 法 ， 六 步 
提交 法 的 具体 内 容 参见 第 7 章 。 这 种 工作 方式 ， 对 于 这 个 团队 的 工作 习惯 有 很 大 的 挑战 。 
因此 ， 我 们 专门 组 织 了 一 次 两 小 时 的 学 习 和 讨论 ， 并 制订 了 后 续 要 做 的 一 些 工 作 改 进项 。 

1. 如 何 能 自觉 遵守 CI 纪律 

由 于 开发 人 员 在 之 前 的 工作 中 ,没有 这 样 的 习惯 二 因此 虽然 有 了 约定 ， 但 如 何 更 高 效 
地 监督 这 一 约定 的 执行 呢 ? 我 们 利用 熔 兰 灯 来 帮忙 。 将 它 安 放 在 大 家 的 工作 区 ， 让 它 非 常 
醒目 ， 并 与 CI 服务 器 上 的 状态 联动 ， 当 有 CI 构建 失败 时 7 它 就 会 变 成 红色 。 这 样 就 变 成 了 
众人 监控 的 方式 。 我 也 见 过 各 种 各 样 与 之 类 似 的 做 法 ， 例 如 ”有 使 用 显示 器 显示 构建 状态 
的 ， 也 有 用 播放 音乐 的 方式 的 (其 实 有 点 儿 吵 )。 总 之 ， 就 是 为 了 提醒 大 家 ， 这 像 交 通信 
号 灯 一 样 ， 是 团队 的 质量 法 则 ， 提 醒 团 队 不 要 破坏 团队 协作 文明 。 

2. 编译 时 间 过 长 

项 目 代 码 做 一 次 全 量 编译 ， 需 要 40 分 钟 。 如 果 按 持续 集成 六 步 提 交 法 的 要 求 来 完成 ， 
每 天 要 等 待 很 长 时 间 ， 因 此 必须 解决 这 个 问题 。 开 发 人 员 要 能 够 在 1 分 钟 内 ， 完 成 对 自己 
所 写 代码 的 编译 打包 ， 并 完成 自动 化 测试 的 运行 。 

以 前 的 开发 工作 为 什么 没有 这 个 困扰 呢 ? 因为 原来 提 测 之 前 , 开发 人 员 可 以 根据 自己 
的 需要 来 编译 , 如 在 下 班 临 走 之 前 启动 编译 。 而且 只 要 在 开发 阶段 , 提交 代码 也 比较 随意 ， 
并 不 需要 保证 提交 后 的 代码 能 够 编译 通过 。svn 代 码 库 在 此 时 的 作用 只 是 为 了 防止 代码 的 
丢失 ， 而 不 是 团队 多 人 协作 的 工具 。 

现在 , 在 这 种 返 代 模式 下 , 每 个 开发 人 员 每 天 都 需要 编译 代码 , 而 且 可 能 要 提交 代码 。 
因此 ， 必 须 解 决 编译 时 间 长 的 问题 。 我 们 组 织 了 另外 一 个 小 组 ， 利 用 3 周 时 间 ， 开 发 了 编 
译 任务 的 发 起 端 、 接 收 器 与 分 发 器 ， 并 利用 开源 软件 搭建 了 一 套 分 布 式 编译 集群 (这 是 公 
司 级 C/C++ 编译 集群 的 雏形 )。 也 就 是 说 , 开发 人 员 和 Jenkins 持 续集 成 服务 器 都 可 以 将 自己 
的 编译 构建 任务 放 到 这 个 分 布 式 编译 集群 上 来 执行 。 
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云 编译 构建 平台 


B 公 司 A 业 务 线 的 后 台 服 务 绝 大 多 数 是 Linux 平 台 上 的 C/C++ 程序 。 很 多 开发 人 员 共 
享 同一 个 Linux 物 理 机 进行 编码 工作 ， 每 人 都 分 配 有 账号 和 密码 。 每 个 开发 人 员 均 会 在 
这 人 台 机 器 上 进行 日 常 的 编译 工作 。 机 器 性 能 还 不 错 ， 在 编译 构建 频率 不 高 的 情况 下 ， 其 
他 开发 人 员 感 知 不 明显 。 然 而 ， 使 用 真正 的 持续 集成 模式 以 后 ， 构 建 频率 提高 ， 会 导致 
其 他 开发 人 员 卡 顿 。 

在 这 种 背景 下 ， 公 司 项 目 管 理 部 建立 了 一 个 “构建 云 ?"， 支 持 多 人 并 行 自动 化 编译 
构建 。 同 时 对 每 个 编译 任务 都 可 以 做 到 并 行 化， 以 缩短 单个 编译 构建 任务 的 时 间 。 其 工 
作 方 式 与 7.4 节 中 讨论 的 关于 构建 管理 服务 图 7-9 类 似 ， 其 解决 方案 为 “开源 工具 + 定制 ”， 
其 结构 示意 图 如 图 16-8 所 示 。 

和 月 博 SDERROOOOSOOOOCCNOOECOOROOCOOEEEESRD 区 和 EC 





图 16-8 云 编译 构建 平台 示意 图 


当 开 发 人 员 写 完 代码 ， 准 备 提交 前 ， 在 自己 的 机 器 上 和 运行 一 个 命令 脚本 
localbuild.sh， 这 个 系统 会 将 SVN 当 前 的 版 本 号 与 patch 文 件 一 同 提交 给 服务 端 ， 服 务 端 
将 其 放 到 队列 中 。 一旦 有 空闲 的 资源 ， 就 可 以 自动 编译 打包 。 如 果 出 错 ， 程 序 员 就 能 立 
即 得 到 反馈 。 如 果 没 有 问题 ， 开 发 人 员 就 可 以 提交 代码 了 。 

该 平台 是 基于 一 系列 的 开源 解决 方案 , 再 加 上 一 些 定制 开发 , 可 以 提供 增 量 编译 和 
全 量 编译 两 种 方式 。 其 中 ， 编 译 集群 中 最 初 包 含 30 台 编译 机 ， 环 境 统 一 管理 ， 可 以 确保 
无 论 谁 修改 的 代码 ， 其 所 需要 的 依赖 库 、 编 译 器 版 本 等 都 是 一 致 的 ， 消 除 因 这 些 因素 导 
致 编译 构建 失败 的 问题 。 

通过 分 布 式 编译 机 制 ， 缩 短 了 整个 编译 时 间 。 开 发 人 员 平 时 可 使 用 增 量 编译 ， 提交 
前 使 用 全 量 编译 ， 而 CI 平台 一 直 使 用 全 量 编译 。 这 样 ， 就 可 以 在 反馈 速度 与 反馈 质量 之 
间 求 得 平衡 。 
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3. 开发 人 员 无 法 运行 自动 化 测试 

产品 原来 有 一 批 自动 化 测试 用 例 , 被 保存 在 测试 部 门 自己 的 测试 代码 库 里 。 只 有 那些 
有 权限 的 人 (测试 人 员 ) 才能 运行 这 些 测试 用 例 。 传 统 开发 模式 下 这 种 做 法 是 很 自然 的 。 
因为 通常 是 由 测试 人 员 编写 ， 用 来 做 回归 测试 或 作为 提 测 标准 门槛 使 用 ， 以 便 提高 测试 人 
员 的 效率 ， 其 写作 时 间 也 通常 在 产品 某 个 版 本 基本 稳定 之 后 ， 由 专人 负责 。 而 且 测 试 的 准 
备 成 本 较 高 ， 包 括 机 器 的 申请 、 系 统 的 安装 、 数 据 的 准备 等 。 但 在 传统 开发 方式 下 ， 因 为 
这 些 自动 化 的 运行 频率 比较 低 (可 能 一 个 季度 才 准 备 一 次 )， 所 以 这 些 因素 产生 的 成 本 也 
不 算 什么 大 事 。 

在 迭代 开发 中 ， 自 动 化 测试 的 第 一 用 户 显然 是 开发 人 员 , 他 们 应 该 在 第 一 时 间 就 用 这 
些 自动 化 测试 来 检查 新 修改 的 代码 是 否 破坏 了 原 有 的 功能 。 开 发 人 员 应 该 在 提交 代码 之 前 
就 能 够 运行 这 些 自动 化 测试 。 那 么 ， 执 行 频率 一 旦 提高 ， 原 来 不 成 为 问题 的 测试 准备 及 运 
行 问题 就 真正 成 了 大 问题 ， 必 须 进 行 改进 。 

测试 人 员 非 常 支持 这 种 工作 方式 ,马上 就 申请 了 机 器 资源 ， 用 于 专门 运行 这 些 自动 化 
测试 。 由 于 自动 化 测试 用 例 代码 与 测试 用 例 管理 系统 绑 定 较 紧 ， 在 较 短 的 时 间 内 无 法 快速 
搬迁 代码 库 (其 实 还 需要 与 测试 部 门 的 管理 者 们 协商 ,需要 时 间 )。 因 此 ， 我 们 决定 ， 在 
第 一 个 阶段 暂时 由 测试 人 员 提 供 一 个 脚本 给 开发 人 员 交 用 于 调用 这 些 自动 化 测试 用 例 自动 
运行 。 而 每 次 执行 自动 化 测试 时 ， 到 底 运行 哪些 用 例 有 由 测试 大 员 在 后 台 脚 本 配置 。 测 试 
所 需 数 据 的 准备 也 由 测试 人 员 完 成 ， 做 到 一 键 式 测试 数据 准备 

4. 自动 化 测试 的 策略 

由 于 迭代 开发 要 求 快 速 测 试 ， 既 然 我 们 已 经 有 一 些 自动 化 测试 ， 当 然 要 利用 起 来 。 但 
是 ， 新 的 自动 化 测试 用 例 什么 时 间 写 ? 什么 时 机 运行 ? 由 谁 来 号? 写 哪些 自动 化 测试 用 
例 ? 所 有 这 些 问 题 ， 都 需要 团队 在 工作 前 达成 一 致 。 根 据 自动 化 测试 金字 塔 理 论 (参见 第 
10 章 )， 以 及 目前 团队 的 状况 ， 我 们 做 出 了 测试 约定 ， 如 图 16-9 所 示 。 

(1) 单元 测试 : 团队 从 来 没有 写 过 单元 测试 ， 在 没有 比较 好 的 单元 测试 练习 前 ， 马 上 
要 求 所 有 人 员 写 单元 测试 , 会 令 大 家 感到 不 适 ， 同 时 ， 写 出 的 单元 测试 用 例 质 量 也 相对 较 
低 。 如 果 现 在 立即 实施 ， 成 本 会 比较 高 。 因 此 在 试点 第 一 阶段 暂时 不 做 。 

(2) 模块 自动 化 测试 : 是 指针 对 某 个 模块 由 其 内 部 几 个 类 共同 实现 的 其 个 功能 进行 自 
动 化 测试 。 此 类 测试 会 根据 需求 的 不 同 而 确定 。 通 常 来 说 ， 如 果 该 功能 在 对 外 接口 没有 直 
接 表 现 ， 则 会 在 此 处 进行 功能 自动 化 测试 。 

(3) 服务 接口 自动 化 测试 : 是 指针 对 某 个 模块 对 外 提供 的 接口 调用 进行 自动 化 测试 。 
在 这 一 层次 ， 团 队 对 其 进行 全 面 测试 ， 并 力争 做 到 全 面 自动 化 覆盖 。 因 为 整个 子 系统 基本 
具备 “高 内 聚 ， 低 耦合 ”的 特点 ， 而 且 每 个 子 模块 的 边界 也 基本 清晰 ， 所 以 在 这 个 层次 上 
做 自动 化 测试 ， 现 在 的 ROI 是 最 划算 的 。 
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(4) 子 系 统 级 自动 化 测试 : 是 指针 对 由 团队 负责 的 S 服 务 (包含 7 个 服务 模块 ) 进行 整 
体 端 到 端的 自动 化 测试 。 这 一 级 自动 化 测试 主要 覆盖 服务 的 主要 流程 ， 确 保 各 服务 模块 之 
间 的 运行 正确 。 由 于 成 本 较 高 ， 环 境 较为 复杂 ， 团 队 会 在 开发 需求 之 前 ， 根 据 具体 情况 ， 
确定 是 否 进行 自动 化 测试 用 例 的 开发 。 

(5) 大 环 自动 化 测试 : 是 指 S 服 务 与 外 部 系统 的 交互 测试 。 由 于 成 本 最 高 ， 环 境 最 为 
复杂 ， 依 赖 因素 更 多 ， 这 部 分 的 自动 化 测试 用 例 最 少 。 团 队 会 在 开发 需求 之 前 ， 根 据 具体 
情况 ， 确 定 是 否 进行 这 部 分 自动 化 测试 用 例 的 开发 。 














4 探索 性 测试 为 主 

> 视 需求 而 定 
子 服务 系统 
自动 化 测试 

- 全 面 自动 化 

服务 接口 自动 化 测试 

模块 自动 化 测试 

自动 化 单元 测试 “、、 “> 视 需求 而 定 





图 16-9 ”自动 化 测试 的 分 布 


当 启 动 一 个 新 需求 的 开发 之 前 ， 由 开发 人 员 和 测试 人 员 共 同 讨论 , 确定 在 模块 自动 化 
和 大 环 自动 化 这 两 个 层次 上 ， 需 要 对 哪些 验证 点 进行 自动 化 测试 用 例 ， 哪 些 验证 点 进行 手 
工 测 试 。 

上 述 的 所 有 自动 化 测试 用 例 由 测试 人 员 编 写 。 每 个 开发 人 员 可 以 在 自己 的 开发 机 上 通 
过 执行 一 条 命令 ,调用 一 个 由 测试 人 员 提 供 的 脚本 ,就 可 以 运行 他 希望 运行 的 所 有 自动 化 
测试 。 每 次 开发 人 员 提 交代 码 变 更 之 前 都 要 求 运行 所 有 自动 化 测试 用 例 。 当 代码 变更 提交 
到 项 目 开 发 主干 以 后 ， 会 自动 触发 所 有 自动 化 测试 用 例 。 

5. 自动 化 测试 所 需 的 运行 环境 不 足 怎么 办 

在 过 去 传统 瀑布 开发 方式 下， 自动 化 测试 用 例 的 服务 对 象 是 测试 人 员 ， 其 主要 目标 是 
用 于 回归 测试 ， 使 用 频率 较 低 ， 通 党 都 是 在 开发 联 调 阶段 结束 后 作为 提 测 准 入 标准 ， 或 者 
作为 多 轮 集成 测试 的 一 部 分 。 而且， 回归 测试 用 例 主 要 集中 于 以 前 各 版 本 中 的 基本 回归 测 























298 ”第 16 章 研发 推动 的 DevOps 











试用 例 〈 通 常 称 为 基本 核心 测试 用 例 集 ) ， 相 对 软件 所 提供 的 功能 集 来 说 ， 履 盖 范 围 相 对 
较 少 。 正 是 由 于 以 上 因素 ， 其 运行 所 需要 的 环境 也 不 要 求 太 多 ， 通 常 一 个 项 目 一 套 就 足够 
了 ， 甚 至 多 个 项 目 共 用 一 套 ， 或 者 手工 测试 与 自动 化 测试 共用 同一 环境 。 

然而 , 在 支持 持续 集成 的 夺 代 开发 方式 中 , 所 有 的 开发 人 员 都 需要 运行 自动 化 测试 用 
例 ， 而 且 每 次 提交 代码 都 需要 触发 自动 化 测试 用 例 ， 因 此 ， 开发 人 员 成 了 自动 化 测试 的 第 
一 用 户 ， 而 开发 人 员 远 多 于 测试 人 员 。 因 此 ， 我 们 需要 更 多 的 测试 环境 。 

原来 的 自动 化 测试 需要 将 7 个 模块 部 署 到 3 台 物 理 机 上 才能 运行 。 而 我 们 无 法 申请 到 这 
么 多 资源 ， 来 部 署 多 套 自动 化 测试 环境 。 经 过 讨论 发 现 ， 需 要 3 台 物 理 机 的 原因 在 于 ，7 个 
模块 中 的 一 些 配 置信 息 被 硬 编码 到 代码 中 ， 代 码 编译 打包 后 就 无 法 更 改 。 如 果 把 7 个 模块 
直接 安装 到 同一 台 机 器 上 , 会 因为 配置 信息 的 冲突 (如 日 志 输 入 的 目录 、 模 块 与 模块 之 间 
通信 使 用 的 端口 号 ) 而 无 法 使 用 。 我 们 对 这 类 问题 进行 了 代码 修改 ， 全 部 更 改 为 可 配置 的 
方式 ， 从 而 让 7 个 模块 可 以 部 署 到 同一 台 机 器 上 。 

经 过 改造 后 ， 在 同一 台 物 理 机 上 ， 可 以 部 署 3 套 各 自 独立 的 环境 。 这样， 开发 人 员 就 
有 足够 多 的 环境 运行 自动 化 测试 了 。 

6. 如 何 确定 一 个 需求 可 以 提 测 

当 开发 人 员 认 为 自己 已 经 开发 完成 某 个 需求 时 有 两 个 条 件 。 

(1) 测试 人 员 在 开发 人 员 的 机 器 上 体验 过 该 需求 6 

(2) 所 有 的 自动 化 测试 都 通过 了 (包括 针对 该 需求 新 增加 和 修改 后 的 自动 化 测试 )。 

满足 这 两 个 条 件 后 ,开发 人 员 将 包含 该 需求 的 构建 号 通知 测试 人 员 , 测试 人 员 即 可 从 
持续 集成 系统 上 下 载 对 应 构建 号 的 安装 包 ， 进 行 更 全 面 的 功能 测试 。 

7. 如 何 做 性 能 和 压力 测试 

我 们 需要 尽 可 能 早 地 反馈 正在 开发 的 软件 质量 状况 ， 怎 么 可 能 忘记 性 能 和 压力 测试 。 
但 原来 这 类 测试 都 是 放 在 后 期 测试 阶段 做 的 ， 通常 准备 时 间 比 较 长 ,运行 时 间 比 较 长 ,成 
本 比较 高 。 为 了 能 够 在 快速 反馈 和 高 成 本 的 全 面 质量 监控 之 间 做 到 平衡 ,我 们 的 应 对 策略 
是 : 使 用 部 分 关键 性 用 例 ， 选 择 特 定 的 指标 维度 ， 在 较 短 时 间 内 运行 完 这 些 测试 ， 再 通过 
性 能 或 压力 曲线 来 判断 性 能 和 压力 方面 的 风险 。 

由 于 时 间 有 限 , 我 们 无 法 在 短期 内 开发 出 做 曲线 对 比 的 自动 化 程序 ， 因 此 仅 针对 几 个 
间 标 给 定 国 值 ， 有 异常 就 报警 。 另 外 ， 还 会 定期 人 工 对 比 。 这 样 ， 基 本 上 每 个 达 代 都 可 以 
保证 对 包含 最 新 功能 的 版 本 做 一 到 两 次 的 性 能 和 压力 测试 。 如 果 发 现 了 性 能 隐患 ， 团 队 会 
立即 指定 人 员 进行 分 析 ， 并 根据 分 析 结 果 ， 共 同 决定 修复 的 具体 时 间 安 排 。 

虽然 这 种 方法 无 法 做 到 完全 反映 真实 情况 ， 但 是 在 开发 过 程 中 可 以 降低 一 部 分 质量 
风险 。 

(1) 对 开发 人 员 的 工作 要 求 

在 传统 瀑布 工作 模式 下 ,开发 周期 较 长 , 每 个 开发 人 员 独 自负 责 一 到 两 个 模块 的 开发 
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任务 ， 所 有 人 开发 完成 之 后 ， 再 一 起 进行 联 调 。 而 在 迭代 开发 的 工作 模式 下 ， 所 有 需求 是 
根据 PARID 五 因素 综合 优先 级 排 和 人 迭代 计划 当中 的 ， 这 要 求 每 个 开发 人 员 都 尽 可 能 多 地 了 
解 和 修改 不 同 的 模块 功能 ， 才 能 够 不 耽误 项 目 进度 。 

对 本 项 目 来 说 ， 所 有 人 员 都 会 C/C++ 编程 语言 ， 因 此 编程 技能 不 是 问题 。 而 对 S 服 务 
来 说 ， 团 队 成 员 也 基本 了 解 ， 只 是 熟悉 程度 不 同 。 因 此 ， 基 本 可 以 认为 ， 每 个 人 都 有 能 力 
修改 其 中 的 几 个 模块 (并非 全 部 )。 

(2) 团队 的 自我 主动 改进 

团队 每 个 迭代 举行 团队 回顾 会 议 ， 这 与 通常 的 项 目 总 结 会 议 有 所 不 同 。 回 顾 是 对 工 
作 过 程 中 团队 成 员 的 协作 方式 、 工 作 活动 的 约定 、 团 队 面 临 的 问题 以 及 可 能 的 解决 方案 
进行 讨论 ， 从 而 让 团队 不 断 完善 自我 ， 更 开心 、 更 高 效 地 工作 。 这 种 用 于 自我 主动 改进 
的 回顾 会 议 是 最 为 重要 的 敏捷 实践 ， 即 便 其 他 实践 都 无 法 执行 ， 团 队 也 应 该 坚持 这 个 会 
议 活动 。 

很 多 使 用 “敏捷 开发 方法 ”的 团队 会 忽略 迭代 回顾 ， 或 者 将 它 变 成 互相 吐槽 会 ， 这 是 
对 团队 非常 不 利 的 。 前 者 会 让 团队 的 长 期 战斗 力 下 降 ， 后 者 则 更 糟糕 ， 连 团队 的 凝聚 力 都 
无 法 保证 。 

在 回顾 会 议 之 后 ,团队 也 会 花 一 点 儿 时 间 做 一 下 简单 计划 ,， 即 根据 上 个 迭代 的 任务 完 
成 情况 ， 以 及 对 下 一 个 迭代 时 间 的 估计 ， 由 开发 人 员 进 行 评估 ， 从 需求 列表 中 选取 优先 级 
高 的 需求 项 ， 作 为 下 一 个 迭代 的 目标 。 我 们 并 没有 专门 组 织 对 已 完成 的 功能 进行 演示 ， 因 
为 每 个 人 天 天 都 能 看 到 项 目的 真实 进展 。 












































别 走 得 太 快 ， 等 一 等 灵魂 

这 是 一 个 关于 印 地 安 人 的 传说 。 很 久 以 前 , 一 个 考察 队 到 神秘 的 原始 森林 里 探险 考 
察 ,请 了 当地 的 印 地 安 人 做 向 导 。 几 个 印 地 安 人 向 导 带 着 考察 队 出 发 了 ， 一 路 上 ， 他 们 
不 但 要 负重 前 行 , 还 要 时 时 手持 砍刀 在 密林 里 砍伐 藤 条 树枝 , 臂 出 供 考察 队 行走 的 小 路 。 
这 样 辛苦 地 赶 了 3 天 的 路 。 可 是 ， 第 4 天 早上 ， 几 个 向 导 坚 持 要 求 原 地 休息 。 考 察 队 弄 不 
清楚 是 哪里 出 了 问题 ， 询 问 之 下 ， 得 到 了 严肃 的 回复 : 一 定 要 休息 一 天 ， 因 为 他 们 匆匆 
忙 忙 地 赶 了 3 天 的 路 ， 他 们 的 灵魂 一 定 赶不上 他 们 的 脚步 了 ， 所 以 有 必要 停 下 来 ， 等 待 
他 们 的 灵魂 追赶 上 来 。 


(3) 不 能 修改 最 初 估 算 的 大 小 
如 果 是 新 增 的 需求 ， 可 以 进行 估算 ,但 对 于 已 经 估算 过 的 需求 ,不必 重新 估算 了 。 原 
因 很 简单 。 
。 对 于 新 增 需求 :因为 以 前 没有 估算 过 ， 所 以 需要 做 一 个 快速 讨论 、 快 速 估算 ， 以 
便 加 入 项 目 开发 计划 当中 。 
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e 对 于 已 佑 需求 : 单个 需求 的 估算 本 来 不 精确 。 之 前 的 估算 方式 的 假设 前 提 是 基于 
需求 整体 的 总 量 估 算 ， 即 这 一 堆 需 求 的 总 量 不 会 因 个 别 需求 的 估算 偏差 而 偏差 太 
多 。 在 项 目 进展 过 程 中 ， 也 有 开发 人 员 提 出 某 个 需求 的 实际 工作 量 要 大 于 其 估计 
值 很 多 ， 要 求 重新 估计 。 

(4) 燃烧 图 中 的 秘密 

图 16-10 是 该 项 目 在 第 一 阶段 的 燃烧 图 (bum-up chart)， 模 轴 是 时 间 (以 周 为 单位 )， 

纵 轴 是 工作 量 〈 点 数 )。3 条 曲线 自 上 而 下 分 别 代表 项 目的 需求 范围 、 开 发 完成 的 数量 和 验 

收 通过 的 数量 。 这 个 燃烧 图 反映 了 很 多 团队 刚刚 接触 这 种 欠 代 开发 方法 时 会 遇 到 的 问题 。 
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1 2 3 4 5 6 7 8 9W10 1 历 13 14 ( 周 ) 
图 16-10 ”敏捷 101 阶 段 的 项 目 进 度 燃 烧 图 


@ 代码 耦合 度 和 旧 的 开发 习惯 会 影响 迭代 交付 。 在 项 目的 前 3 周 ， 没 有 开发 完成 任何 
需求 。 这 是 为 什么 呢 ? 团队 在 做 项 目 计划 时 ， 已 经 将 需求 拆 分 成 比较 细 的 粒度 了 ， 开 发 人 
员 也 确认 这 些 需求 是 可 以 独立 开发 的 啊 ! 事实 上 ， 高 优先 级 的 几 个 需求 在 代码 层面 上 相互 
交叉 干扰 。 开 发 人 员 在 开发 第 一 个 需求 时 ， 发 现 需要 修改 第 二 个 需求 涉及 的 代码 块 ， 其 软 
件 模块 化 工作 并 没有 计划 时 想象 得 那么 好 。 

另外 ， 这 也 与 原 有 的 开发 习惯 有 关系 ， 也 就 是 说 ， 开 发 人 员 正 在 开发 当前 需求 时 ， 总 
是 情不自禁 地 和 希望 把 与 之 相关 联 的 第 二 个 需求 也 一 并 实现 ， 觉 得 自己 省 时 省 力 ， 免 得 回 过 
头 来 ， 还 要 再 次 来 修改 这 里 的 代码 。 虽 然 原 因 不 同 ， 但 结果 是 相同 的 ， 也 就 是 说 ， 只 有 在 
3 个 帮 代 结束 以 后 ， 才 刚刚 有 需求 被 开发 完成 ， 可 以 进行 测试 。 

@ 开发 人 员 的 估计 总 是 乐观 的 ,细心 的 读者 还 会 发 现 项 目 计划 出 现 了 问题 , 那 就 是 : 
最 初 计划 是 9 个 迭代 完成 ， 而 在 燃烧 图 上 已 经 到 了 第 14 周 还 没有 开发 完成 。 这 是 为 什么 
呢 ? 

一 方面 在 项 目 开始 前 做 估算 时 ， 开 发 人 员 并 没有 意识 到 使 用 敏捷 迭代 开发 方式 ， 高 质 
量 迭 代 交 付 对 代码 开发 质量 的 挑战 。 由 于 在 之 前 的 长 期 工作 中 , 开发 人 员 习 惯 于 先 把 功能 
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全 部 开发 完成 (基本 可 以 跑 通 )， 然 后 在 联 调 期 和 测试 期 时 修复 其 中 存在 的 很 多 问题 和 缺 
陷 。 也 就 是 说 ， 原 来 在 开发 阶段 的 质量 要 求 并 不 高 ， 只 要 开发 人 员 认为 没有 大 问题 ， 就 算 
“开发 完成 "。 因 此 ， 在 项 目 初期 做 计划 时 的 估算 也 是 基于 这 样 的 质量 标准 。 

另 一 方面 , 非 本 项 目的 事务 所 占用 的 时 间 比 团队 预 估 的 时 间 多 。 团 队 预 估 非 项 目 事务 
的 处 理会 占用 40% 的 时 间 。 但 实际 情况 却 不 是 这 样 的。 在 第 一 个 迭代 里 ， 我 们 就 意识 到 了 
这 个 问题 。 因 为 每 天 站 会 上 ， 大 家 都 会 提 到 这 部 分 事情 。 于 是 ， 在 第 二 个 迭代 中 ， 团 队 每 
天 会 记录 一 下 自己 相关 活动 的 上 时间。 此 时 ， 我 们 并 不 关注 这 些 突 发 事件 是 什么 ， 而 是 关注 
它 每 天 占用 了 团队 成 员 多 少时 间 。 

统计 方法 很 简单 , 在 故事 墙 (需求 白板 ) 的 旁边 , 还 有 一 块 白板 , 我 们 画 了 一 个 表格 ， 
记录 每 个 人 在 3 类 不 同事 务 所 花费 的 上 时间， 分 别 包 括 项 目 内 时 间 、 与 其 他 团队 交流 和 线 上 
监控 与 问题 分 析 修 复 。 填 写 规则 也 很 简单 : 每 个 人 逐 天 记录 ， 每 天 早上 站 会 后 填写 ， 记录 
精度 只 需要 到 半 小 时 ， 填写 实际 工作 时 间 ， 即 每 天 可 以 少 于 8 小 时 ， 如 果 有 加 班 ， 加 班 时 
间 也 算 在 内 ， 即 每 天 有 可 能 超过 8 小 时 工作 ， 如 表 16-1 所 列 〈 表 中 信息 仅 为 示意 ， 并 非 真 
实数 据 ) 。 









































表 16-1 团队 成 员工 作 时 间 分 配 表 





























时 间 张 XX 李 XX 杨 XX 吴 XX 

某 月 某 日 2/3/1 2/2/1 1/1/2 1/1/2 

某 月 某 日 0.5/2/3 1/2/3 2/2/1 3/2/0.5 

某 月 某 日 2/2/1 2/2/1 2/2/1 2/2/1 

团队 做 了 两 点 约定 : 一 是 收集 的 具体 数据 不 对 外 公开 ; 二 是 与 个 人 考核 无 关 ， 相 信 每 


个 人 都 尽 了 最 大 的 努力 。 

经 过 统计 ， 我 们 发 现 “ 项 目 内 时 间 ” 这 一 项 上 ， 资 深信 员 的 投入 只 有 30% ， 初 级 人 员 
的 投入 则 是 50%。 这 比 我 们 的 估计 (60%) 少 了 三 分 之 一 ! 所 以 ， 在 项 目 开始 的 第 4 周 ， 
我 们 就 知道 初始 计划 的 其 中 一 个 假设 (人员 时 间 投 入 ) 是 不 成 立 的 。 因 此 ， 与 团队 的 相 
关 干 系 人 都 进行 了 沟通 ， 以 便 让 他 们 知道 项 目的 具体 情况 和 风险 ， 并 对 交付 预期 做 出 相 
应 调整 。 

最 终 , 这 个 项 目 在 6 月 底 开发 迭代 完成 , 并 在 7 月 中 旬 完 成 全 面 的 济 试验 收 , 准备 上 线 。 
这 也 是 第 二 阶段 的 旅程 一 一 DevOps 变 革 的 持续 交付 之 旅 的 起 点 。 


16.2.4 ”阶段 性 改进 点 


在 这 一 阶段 的 改进 中 ， 我 们 主要 对 3 个 方面 进行 改造 ， 如 图 16-11 所 示 ， 它 们 分 别 是 业 
务 需 求 协作 管理 、 构 建 与 测试 管理 和 环境 与 数据 管理 。 其 中 ， 对 于 需求 协作 管理 和 构建 测 
试管 理 的 改造 最 大 ， 基 本 上 凑 履 了 原 有 的 整个 研发 管理 流程 ， 这 也 使 得 团队 的 工作 面貌 发 
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生 了 改变 。 其 主要 的 改进 工作 包括 以 下 7 点 : 
(1) 业务 目标 合理 ， 














) 
(2) 项 目 计 划 透 明 (过 程 透 明 & 结 果 透 明 )， 
(3) 流程 “ 自 定 义 ， 自 遵守 ”， 团 队 确 保 高 质量 交付 ; 
(4) 定期 主动 回顾 ， 而 非 事 件 驱 动 的 回顾 ， 
(5) 通过 细 粒 度 需 求 组 织 开 发 流程 ， 
(6) 持 弓 云集 成 六 步 提交 法 ; 
(7) 适当 使 用 自动 化 测试 ， 提 高 质量 反馈 效率 
基础 设施 
部 署 发 布 与 > 
业务 需求 监控 管理 
协作 管理 
由 ©@ 
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图 16-11 ”持续 交付 七 巧 板 的 改进 版 图 
16.3 第 二 阶段 :DevOps 转 型 


整个 团队 对 于 第 一 阶段 的 产品 质量 非常 有 信心 。 而 且 ， 通 过 第 一 阶段 的 准备 ， 团 队 已 
经 对 整个 研发 流程 体系 及 基础 设施 非常 熟悉 ， 思 想 也 发 生 了 转变 ， 更 主动 倾向 于 “小 批量 
生产 ”方式 。 因 此 ， 我 们 第 二 阶段 的 目标 被 提 到 了 议事 日 程 。 发 布 周期 编 短 到 3 周 ， 并 且 
在 两 个 月 后 ， 达 到 两 周 发 布 一 次 。 
团队 不 再 沿用 原 有 的 “项 目 ” 这 个 概念 ， 而 是 以 “ 城 际 快 线 ” 高 频 发 布 模式 来 安排 
工作 计划 ， 其 代码 分 支 模式 也 相应 地 变 为 “主干 开发 ， 分 支 发 布 ”方式 〈 详 见 第 8 章 )， 如 
图 16-12 所 示 。 
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V3.0 发 布 分 支 V3.1 发 布 分 支 V3.2 发 布 分 支 
开发 主干 ”~ Yy 人 vy J 
两 周 两 周 





图 16-12 ”主干 开发 ， 分 支 发 布 的 城 际 快 线 模式 
16.3.1 与 运 维 人 员 的 “冲突 ” 


根据 几 个 月 的 团队 协作 ,我 最 初 判断 团队 完全 有 能 力 做 到 两 周 发 布 一 次 。 然 而 ,经 过 
讨论 后 ， 团 队 成 员 还 是 决定 不 过 于 激进 ， 先 按 3 周 发 布 一 次 来 调整 ， 这 与 当初 的 3 个 月 发 布 
一 次 相 比 ， 已 经 进步 很 多 了 。 

当 给 使 用 S 服 务 的 客户 讲解 即将 启用 的 “ 城 际 快 线 ” 研 发 运作 模式 时 ， 他 们 受到 极 大 
肯定 ,纷纷 表示 可 以 解决 “需求 响应 不 及 时 ”的 老大 难 问题 。 并 且 同 意 按 以 下 方式 进行 需 
求 排 期 管理 。 

(1) 在 wiki 上 发 布 时 间 点 ， 以 及 对 应 的 需求 发 布 列表 ，; 

(2) 客户 方 可 随时 提交 需求 ; 

(3) 需求 列表 中 ， 不 但 有 客户 需求 ， 还 包含 自我 优化 需求 ; 

(4) 每 周一 进行 需求 碰头 会 ， 用 于 协商 调整 需求 排 期 。 

然而 ， 当 运 维 人 员 听 到 了 这 个 决定 时 ， 马 上 提出 反对 意见 。 主 要 原因 有 以 下 两 个 。 

(1) 运 维 人 员 很 担心 无 法 保证 产品 的 质量 ， 导 致 生产 事故 。 原 来 项 目的 测试 时 间 那 么 
长 ， 我 们 还 总 会 出 现 这 样 或 那样 的 问题 ， 现 在 测试 时 间 这 么 短 ， 那 一 定 会 出 线 上 问题 的 。 

(2) 我 会 被 累 死 的 。 

产品 每 次 发 布 ， 都 需要 部 署 到 300 多 台 机 器 上 。 传 统 方式 下 ， 每 3 个 月 才 部 署 一 次 ; 而 
现在 要 每 3 周 部 署 一 次 。 工 作 量 增加 了 4 倍 ! 

关于 产品 质量 的 担心 , 这 是 难免 的 , 也 是 正常 的 。 因为 这 是 他 对 过 去 工作 的 经 验 总 结 。 
要 打消 掉 这 一 担心 ， 必 须 双 管 齐 下 。 

首先 ， 让 运 维 人 员 参 与 团队 的 日 常 运作 ， 增 加 透明 度 。 

(1) 开发 负责 人 为 运 维 人 员 详细 讲解 了 目前 使 用 的 研发 流程 模式 ， 让 他 了 解 现 在 的 各 
种 过 程 质量 保障 手段 。 

(2) 邀请 运 维 人 员 参 与 到 团队 活动 中 ， 参 与 我 们 日 常 工作 的 一 些 讨论 。 例 如 ， 运 维 人 
员 每 周至 少 参 加 两 次 团队 站 会 ， 同 时 参与 团队 迭代 回顾 会 议 。 

(3) 将 运 维 人 员 加 入 日 常 团队 工作 的 沟通 群 中 ， 以 便 他 随时 了 解 项 目的 运作 状况 。 这 
对 运 维 人 员 来 说 ， 团 队 不 再 是 一 个 完全 看 不 到 内 部 的 “ 黑 盒 ”。 
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其 次 ， 对 $ 服 务 的 部 署 和 运 维 工 作 进 行 优 化 ， 最 大 程度 地 减少 运 维 人 员 的 工作 量 。 团 
队 承 诺 会 针对 快速 发 布 的 运 维 需 求 , 做 出 相应 的 系统 架构 调整 , 使 运 维 工作 更 加 简单 高 效 。 
在 过 去 ， 团 队 “ 太 忙 ， 没 有 时 间 ”， 很 少 理会 运 维 人 员 提 出 的 运 维 相关 要 求 。 然 而 ， 一 旦 
提高 发 布 频率 ， 原 来 都 不 是 困难 的 事情 ， 现 在 都 变 成 了 需要 解决 的 问题 。 如 果 每 两 周 要 在 
300 多 台 机 器 上 进行 一 次 部 署 操作 ， 就 需要 针对 快速 发 布 的 运 维 需求 进行 架构 梳理 改进 ， 
以 便 将 原来 很 多 的 手工 操作 变 成 自动 化 操作 。 
16.3.2 ”高 频 部 署 发 布 中 的 具体 障碍 
整个 团队 (包括 运 维 人员 ) 一 起 坐 下 来 ,讨论 了 存在 的 和 可 能 存在 的 问题 。 关 于 运 维 
部 署 方面 ， 有 一 些 具体 问题 要 解决 。 例 如 : 
e 由 于 历史 原因 ， 各 模块 的 部 署 方式 不 一 致 。 虽 然 经 过 第 一 阶段 的 改造 ， 每 个 模块 的 
日 志文 持 灵活 配置 ， 但 是 生产 环境 中 的 真实 配置 项 并 没有 改变 ， 不 利于 统一 运 维 ， 
。 有 两 个 模块 在 部 署 时 ， 运 维和 人员 需要 和 手工 创建 某 个 目录 ， 备 份 程序 运行 时 产生 的 
临时 数据 ， 
。 相同 模块 在 每 台 机 器 上 的 部 署 位 置 都 有 差别 5 
e 相同 模块 在 每 台 机 器 上 配置 的 端口 策略 也 不 一 致 ， 
e 有 两 个 服务 模块 所 用 的 端口 和 程序 所 用 目录 路 径 为 二 便 编码 ”; 
。 部 署 操作 文档 由 开发 人 员 在 每 次 上 线 前 编写 , 运 维 人 员 对 照 操 作文 档 完成 实际 执 
行 操作 ， 
。 生产 环境 的 部 署 方式 与 测试 环境 和 试 运 行 环境 的 部 署 方式 有 所 不 同 。 
这 些 做 法 或 现象 违背 了 基础 设施 管理 中 的 多 项 管理 原则 。 另 外 ,还 有 一 些 遗 留 问题 需 
要 解决 。 例 如 : 
e 测试 代码 仍旧 在 独立 的 测试 代码 库 里 ， 
e 开发 人 员 的 开发 调试 环境 仍 是 共用 的 ， 只 有 一 套 ， 会 互相 干扰 ; 
。 目前 自动 化 测试 覆盖 仍旧 不 足 ， 测 试 人 员 还 需要 执行 很 多 手工 回归 调试 。 


16.3.3 整体 解决 方案 的 设计 


现在 ,管理 者 和 团队 成 员 都 已 经 接受 了 这 种 软件 研发 模式 ， 并 且 希 望 进一步 地 改进 。 
为 了 能 够 尽早 实现 高 频 发 布 ， 我 们 对 前 面 提 到 的 一 系列 问题 进行 了 整体 解决 方案 的 设计 ， 
从 各 个 维度 对 研发 基础 设施 进行 了 改造 。 

1. 自动 化 测试 策略 的 调整 

通过 第 一 阶段 的 自动 化 测试 知识 积累 , 团队 已 经 基本 和 擎 握 了 自动 化 测试 用 例 编 写 的 原 
则 。 我 们 决定 将 自动 化 测试 层次 向 两 端 扩展 ， 如 图 16-13 所 示 。 我 们 对 全 体 开发 人 员 做 了 单 
元 测试 框架 的 使 用 培训 。 
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在 多 个 层次 上 的 测试 用 例 覆 盖 测 试 相同 的 逻辑 就 是 一 种 浪费 , 既 包 括 写作 维护 成 本 上 
的 浪费 ， 也 包括 数据 准备 和 运行 时 间 上 的 浪费 。 如 何 才 能 减少 或 没有 这 样 的 浪费 呢 ?” 了 唯一 
的 办 法 就 是 进一步 加 强 开发 人 员 和 测试 人 员 之 间 的 沟通 ， 也 就 是 说 ,做 到 测试 人 员 可 以 做 
到 白 盒 〈 灰 盒 ) 分 析 ， 做 灰 盒 〈 黑 盒 ) 测试 。 该 团队 的 测试 人 员 都 具备 编码 能 力 ， 同 时 也 
接受 这 种 “通过 低层 测试 来 验证 那些 很 难 在 高 层 进行 的 测试 ”的 思想 。 


探索 性 测试 为 主 


















> 视 需 求 而 定 
子 服务 系统 
自动 化 测试 
- 全 面 自动 化 
服务 接口 自动 化 测试 
模块 自动 化 测试 
自动 化 单元 测试 “、、 “> 视 需求 而 定 





图 16-13 ”扩大 自动 化 测试 层次 的 覆盖 度 


2. 自动 化 测试 的 便捷 性 

由 于 我 们 计划 的 这 种 快速 迭代 发 布 对 测试 要 求 更 高 ， 因 此 这 种 “高 ”要 求 不 仅 反 映 在 
自动 化 测试 代码 的 编写 方面 ， 还 反映 在 测试 的 执行 效率 和 反馈 速度 方面 。 

为 了 提高 测试 效率 ,并 让 开发 人 员 互 不 影响 ,我们 建立 了 自己 的 测试 集群 。 通 过 软件 
配置 管理 的 优化 ， 对 于 开发 人 员 的 测试 环境 ,通过 配置 文件 的 修改 ， 可 以 做 到 每 两 个 人 共 
用 一 个 开发 测试 环境 。 与 此 同时 ， 我 们 建立 了 多 套 自 动 化 测试 环境 ， 并 保证 多 个 测试 用 例 
集 可 以 同时 并 行 执行 ， 以 确保 更 多 的 自动 化 功能 测试 可 以 在 短 时 间 内 运行 完毕 。 当 然 ， 这 
一 切 都 是 一 键 式 完成 的 ， 这 要 归功 于 两 个 集群 的 完善 一 一 编译 集群 和 测试 集群 。 关 于 这 两 
个 集群 的 设计 方案 ， 参 见 第 7 章 。 

3. 测试 代码 的 同 源 

我 们 将 测试 代码 也 放 到 了 与 产品 代码 相对 应 的 位 置 。 这 样 ， 无 论 是 开发 人 员 ， 还 是 
测试 人 员 , 都 可 以 很 方便 地 获取 与 产品 代码 相对 应 的 测试 代码 , 做 到 它们 之 间 的 一 一 对 应 。 
对 整个 团队 来 说 ， 大 幅度 降低 了 沟通 成 本 和 测试 用 例 的 管理 成 本 。 
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4. 配置 管理 优化 

(1) 代码 库 结构 。 新 建 一 个 产品 目录 (xxService)， 并 将 原来 分 散 到 各 个 不 同 库 中 的 
代码 全 部 迁移 到 该 目录 下， 同时 在 该 目录 下 增加 了 Test 目 录 ， 用 于 存放 对 该 子 服务 的 集成 
测试 代码 ， 如 图 16-14a 所 示 。 























_-->XX/xx/xx/Module A/ XX/XX/XX/XX/output/ 
xx/xx/Service/ 2 a pi 
—Module A ----” tect 下 fi 
一 Module B 一 一 unittest Ea 时 
一 一 Module C totest ”09 
一 一 Module D et ep 
一 ModuleE install EE 
——Module F et 1 ude 
lst —op-bin a 
——config 

一 一 dev 

一 test 

一 一 prod 





(a) 整个 子 服务 的 代码 目录 结构 (b) 其 中 某 个 服务 模块 的 代码 目录 结构 〈c) 其 中 某 个 服务 模块 软件 包 解压 的 目录 结构 
图 16-14 配置 管理 的 统一 规范 化 


另外 ， 在 每 个 模块 下 ， 也 增加 了 一 些 目 录 ， 如 图 16214b 所 示 。 细 心 的 读者 会 发 现 ,在 
test 目 录 下 ， 增 加 了 unittest 目 录 ， 用 于 存放 对 应 模块 的 自动 化 单元 测试 用 例 。 另 外 ,在 模块 
的 根 目 录 下 ， 有 一 个 config 目 录 ， 用 于 存放 该 模块 的 配置 项 信息 ， 如 需要 用 到 的 端口 号 ， 
运行 时 中 间 文 件 的 写 入 目录 等 。 其 中 dev，test，prod 子 目录 存放 的 配置 项 相同 ,但 配置 项 
对 应 的 取 值 不 同 , 分 别 对 应 着 开发 环境 、 生 产 环 境 和 测试 环境 。script 子 目录 中 存放 了 一 些 
脚本 。 由 于 产品 有 一 些 配 置 项 信息 需要 通过 一 定 的 规则 动态 生成 ， 因 此 把 规则 及 脚本 也 放 
入 代码 仓库 中 ， 统 一 进行 版 本 控制 。 

通过 这 种 管理 方式 ， 就 可 以 把 二 进 制 产物 与 配置 项 进行 分 离 。 这 么 做 以 后 ， 针 对 不 同 
类 型 的 部 署 环 境 ， 使 用 “相同 二 进 制 文件 + 不 同 的 配置 文件 ”方式 ， 就 可 以 完成 不 同 环境 
的 部 署 。 同 时 ， 与 src 同 级 别 的 Script 目录 中 ， 有 一 个 install 目 录 。 这 个 目录 中 放置 的 是 该 模 
块 安装 部 署 脚本 。S$ 服 务 各 模块 的 安装 部 署 脚本 全 部 由 运 维 人 员 提供 。 并 且 ， 可 以 在 不 同 
部 署 环境 都 使 用 相同 的 部 署 脚本 ， 通 过 读 取 不 同 的 部 署 信息 完成 不 同 环境 的 软件 部 署 。 

(2) 产 出 物 的 标准 化 与 版 本 管理 。 我 们 在 第 一 阶段 就 已 经 使 用 了 持续 集成 系统 ， 被 测 
试 的 程序 均 来 自持 续集 成 服务 器 上 构建 出 来 的 产物 ， 而 非 测试 人 员 手 工 自 行 编 译 。 因 此 ， 
我 们 就 将 构建 号 (build_id) 作为 识别 二 进 制 产物 不 同 版 本 的 唯一 标识 。 

根据 运 维 需 求 , 我们 又 对 产品 生成 的 安装 包 以 及 安装 后 的 目录 结构 都 做 了 标准 化 ， 如 
图 16-14c 所 示 。 每 一 个 模块 的 输出 结构 都 是 统一 的 。 同 时 安装 包 内 还 有 一 个 文本 文件 ， 文 
件 内 容 是 此 次 构建 中 对 应 的 代码 仓库 的 URL， 以 及 源 代码 版 本 号 (revision id) 。 一 旦 需要 
通过 二 进 制 包 找到 源 代码 ， 就 可 以 解压 这 个 安装 包 ， 查 看 这 个 文本 文件 ， 找 到 对 应 的 代码 
仓库 URL 和 对 应 的 源 代码 版 本 号 。 有 一 些 团 队 也 会 把 源 代码 版 本 号 信息 作为 二 进 制 产物 名 
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称 的 一 部 分 ， 以 便 直接 查看 。 

5. 软件 包 管 理 

线 上 有 300 多 台 机 器 ， 另 外 还 有 很 多 测试 机 (包括 开发 用 的 、 手 工 测 试用 的 和 自动 化 
测试 用 的 )。 我 们 希望 这 些 机 器 上 的 软件 栈 环 境 都 是 受 控 的 ， 而 且 可 以 一 键 式 准备 〈 即 只 
要 运行 一 个 命令 ， 就 可 以 完成 上 述 任意 环境 的 所 有 准备 工作 ) 。 这 样 无 须 他 人 帮助 ,无 论 是 
什么 角色 , 都 可 以 轻松 完成 这 样 的 事情 , 使 其 不 再 成 为 “只 有 专家 才能 做 的 事 ”。 如 图 16-15 
所 示 , 通过 持续 集成 服务 器 自动 构建 的 软件 包 被 放 入 临时 构建 产品 库 后 , 只 有 经 过 一 系列 
的 自动 化 测试 ， 并 经 过 测试 人 员 手 工 验 证 后 ， 才 在 临时 构建 产品 库 中 被 标记 为 “符合 质 
量 标准 ”。 当 需要 获取 某 个 版 本 部 署 时 ， 只 能 从 临时 构建 产品 库 中 选择 那些 符合 质量 标准 
的 版 本 (如 图 中 的 版 本 9) 放 入 产品 发 布 库 ， 然 后 经 过 运 维 人 员 点 击 部 署 按钮 进行 自动 化 
测试 。 
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图 16-15 ”软件 包 发 布 管理 





6. 部 署 与 监控 的 优化 

我 们 计划 使 用 自动 化 方式 进行 生产 环境 的 部 署 。 那么 , 谁 最 了 解 生产 环境 和 运 维 要 求 
呢 ?” 当 然 是 运 维 人 员 自 己 啦 。 于 是 ， 运 维 人 人员 自告奋勇 编写 自动 化 部 署 脚 本 。 

如 何 能 在 部 署 之 前 就 能 够 保证 这 些 脚 本 逻辑 的 正确 性 呢 ? 我 们 想到 , 可 以 在 开发 人 员 
使 用 的 开发 测试 环境 、 测 试 人 员 使 用 的 手工 测试 环境 以 及 自动 化 测试 环境 上 使 用 这 些 脚本 
来 部 署 那 些 在 开发 和 测试 中 的 版 本 。 因 为 这 种 版 本 的 部 署 操 作 很 多 ， 这样 确 保 在 不 同类 型 
的 环境 中 使 用 相同 的 部 署 脚本 ， 读 取 不 同 的 配置 ， 来 完成 各 类 环境 的 部 署 工 作 ， 从 而 在 正 
式 部 署 生产 环境 时 , 这 些 脚本 已 经 被 测试 过 多 次 , 大 大 降低 了 出 错 的 概率 。 真正 做 到 了 “以 
相同 的 方式 ， 向 不 同类 型 的 部 署 环境 一 键 式 部 署 软件 ”。 

与 此 同时 , 我 们 还 设置 了 一 些 监控 脚本 , 用 于 监控 自动 化 部 署 过程 以 及 部 署 后 的 一 些 
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关键 指标 。 从 而 不 必 像 原来 那样 ， 需 要 人 工 方式 来 检查 。 

经 过 这 种 部 署 自动 化 的 改造 , 运 维 人 员 的 每 次 部 署 发 布 , 手工 操作 的 工作 量 降低 为 原 
来 的 十 分 之 一 ， 向 300 台 进行 部 署 的 周期 时 间 也 缩短 为 原来 的 四 分 之 一 。 
16.3.4 DevOps 阶 段 的 团队 改变 

经 过 二 次 改造 ， 团 队 的 工作 流程 如 图 16-16 所 示 。 主 要 的 改变 包括 以 下 4 个 方面 。 
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图 16-16 ”持续 交付 模式 下 的 团队 协作 汶 程 


(1) 完整 的 跨 功 能 团队 ， 运 维 积极 参 与 团队 的 日 常 工作 适 代 会 议 。 

(2) 所 有 内 容 都 做 版 本 控制 ， 包括 源 代码 和 测试 代码 、 各 类 环境 的 配置 项 信息 、 相 关 
的 打包 和 安装 脚本 ， 以 及 一 些 数 据 。 

(3) 所 有 环境 标准 化 管理 ， 可 以 一 键 式 准备 好 测试 环境 。 

(4) 建立 完整 的 部 署 流 水 线 ， 可 以 一 键 式 发 布 到 多 类 部 署 环 境 。 


16.4 小结 


这 个 案例 是 在 不 改变 原 有 公司 组 织 管理 结构 的 条 件 下 ， 实 现 小 团队 持续 交付 的 一 个 
典型 案例 ， 它 是 一 次 由 研发 侧 主动 推动 ， 向 DevOps 工 作 方 式 转变 的 成 功 案例 。 当 然 团队 
具有 了 良好 的 持续 集成 基础 ， 自 然而 然 地 过 渡 到 了 持续 交付 模式 ， 并 形成 了 团队 内 部 的 
DevOps 文 化 。 

本 案例 中 涉及 持续 交付 七 巧 板 中 的 所 有 板块 ， 虽然 有 一 些 板块 改动 较 大 ， 有 一 些 板块 
改动 较 小 ， 如 图 16-17 所 示 。 

所 有 的 改进 都 是 一 种 流程 ， 也 就 是 说 , “明确 目标 一 诊断 问题 一 解决 方案 一 持续 运营 
(优化 )”。 在 这 个 过 程 中 ， 只 要 抱 有 持续 学 习 的 心态 ， 和 掌握 持续 交付 价值 环 的 思考 原则 ， 
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了 解 持续 交付 七 巧 板 中 各 个 领域 的 工作 原则 与 好 的 实践 ， 就 可 以 通过 不 断 试验 ,找到 当前 
的 最 佳 解决 方案 。 


基础 设施 

















组 织 机 制 
图 16-17 全 面 的 持续 交付 改造 





附录 A 


软件 工程 的 三 次 进化 





人 

能 手机 、 便 携 设 备 的 使 用 非常 普遍 ， 甚 至 没有 上 学 的 小 孩 都 可 以 灵活 操作 平板 
电脑 ，60 年 前 ， 文 件 还 不 能 方便 地 在 两 台 计 算 机 之 间 进 行 交 换 ， 甚 至 在 同一 台 计算 机 的 两 
个 不 同 的 应 用 程序 之 间 进 行 交换 也 很 困难 。 今 天 ， 网 络 在 两 个 平台 和 应 用 程序 之 间 提 供 了 
无 损 的 文件 传输 ，30 年 前 ， 多 个 应 用 程序 不 能 方便 地 共享 相同 的 数据 ， 今 天 ,“ 大 数据 ” 
时 代 已 经 降临 ， 在 商业 、 经 济 及 其 他 领域 中 ， 决 策 将 日 益 基于 数据 和 分 析 而 做 出 ， 而 并 非 
基于 经 验 和 直觉 。 软 件 工程 相关 模型 理念 与 方法 框架 的 发 展 如 图 A-1 所 示 。 
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图 A-1 软件 工程 相关 模型 理念 与 方法 框架 的 发 展 简 史 





图 A-1 中 的 各 种 方法 均 以 其 见于 正式 报告 、 书 籍 或 软件 产品 的 时 间 点 为 主要 参考 。 
DSDM 是 指 Dynamic System Development Method (动态 系统 开发 方法 )，XP 是 指 eXtreme 
Programming (极限 编程 )，FDD 是 指 Feature-Driven Development (特性 驱动 开发 )，RUP 
是 指 Rational Unified Process (Rational 统 一 软件 过 程 )，ASD 是 指 Adaptive Software 
Development ( 自 适应 软件 开发 )，SAFe 是 指 Scaled Agile Framework (规模 化 敏捷 框架 )， 
LeSS 是 指 Large-Scale Scrum (大 规模 Scrum)，Nexus 是 指 规 模 化 Scrum 框 架 。 

软件 技术 被 快速 地 应 用 于 各 行 各 业 , 这 也 使 得 软件 相关 的 从 业 人 员 数 量 一直 处 于 紧缺 
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状态 ， 尤 其 是 有 经 验 者 。 为 了 应 对 软件 需求 旺盛 、 从 业 人 员 和 短缺、 软件 本 身 规模 迅速 扩大 
的 问题 ， 软 件 工程 学 科 也 出 现 了 多 种 工程 方法 ， 如 图 A-1 所 示 。 


A.1 软件 工程 的 诞生 


计算 机 诞生 之 时 , 使 用 计算 机 的 门槛 非常 高 (包括 使 用 它 的 成 本 ,以 及 在 计算 机 知识 
和 技能 上 的 要 求 )， 只 有 少数 人 能 够 掌握 。 这 种 昂贵 的 设备 自然 也 就 多 用 于 科学 计算 ， 从 
需求 产生 到 软件 交付 通常 并 不 需要 很 多 人 就 能 完成 。 


A.1.1 软件 危机 


随 着 中 小 规模 集成 电路 的 广泛 应 用 ， 到 了 20 世 纪 50 年 代 到 60 年 代 ， 小 型 机 迁 勃 发 展 ， 
并 且 多 种 高 级 计算 机 语言 也 不 断 出 现 。 软 件 需求 迅速 增长 。 但 是 ， 在 行业 内 的 软件 交付 能 
力 较 低 ， 导 致 软件 开发 与 维护 过 程 中 出 现 以 下 一 系列 严重 问题 。 

(1) 软件 开发 费用 和 进度 失控 。 费 用 超支 、 进 度 拖延 的 情况 屡屡 发 生 。 有 了 时 为 了 赶 进 
度 或 压 成 本 不 得 不 采取 一 些 权宜 之 计 ， 这 样 又 往往 严重 损害 了 软件 产品 的 质量 。 

(2) 软件 的 可 靠 性 差 。 尽 管 耗费 了 大 量 的 人 力 物 力 ， 但 软件 系统 的 正确 性 却 越 来 越 难 
以 保证 ， 出 错 率 大 大 增加 ， 因 软件 错误 而 造成 的 损失 十 分 惊人 。 

(3) 软件 难以 维护 。 缺乏 相应 的 文档 资料 ,程序 错误 难以 定位 ， 难 以 改正 ， 有 了 时 改 
正 了 已 有 的 错误 又 引入 新 的 错误 。 维 护 占 用 了 大 量 人 力 、 物 力 和 财力 。 

1968 年 ， 世 界 各 地 的 计算 机 科学 家 在 联邦 德国 南部 阿尔 卑 斯 山脚 下 的 一 个 美丽 小 镇 
Garmisch 召 开 一 次 国际 性 会 议 ， 第 一 次 讨论 软件 行业 所 遇 到 的 上 述 危机 。 会 议 上 ， 由 下. 蕊 . 
Bauer 提 出 “软件 危机 ”的 概念 ， 用 于 描述 当时 的 问题 。 大 家 希望 能 够 借鉴 建筑 工程 领域 
的 最 佳 实践 (因为 该 领域 已 经 掌握 了 以 系统 化 严格 和 可 衡量 的 方式 按时 、 保 质 、 在 预算 内 
完成 大 规模 工程 项 目的 方法 )， 找 到 软件 行业 所 面临 的 多 人 协作 开发 高 质量 大 型 软件 的 方 
法 。 在 会 议 上 ， 正 式 提出 “软件 工程 ”一 词 ,一 门 新 兴 的 工程 学 科 一 一 软件 工程 学 一 一 为 
研究 和 克服 软件 危机 而 生 。 


A.1.2 瀑布 软件 开发 模型 


20 世 纪 60 年 代 末 ， 作 为 项 目 经 理 的 Dr Winston W Royce 主 导 完 成 了 一 个 大 型 软件 项 目 
的 开发 工作 ， 并 于 1970 年 在 IEEE 发 表 了 一 篇 题 为 “Managing the Development of Large 
Software Systems”( 大 型 软件 系统 的 开发 管理 ) 的 文章 。 在 这 篇 文章 中 他 描述 了 一 种 软件 
开发 模型 ， 如 图 A-2 所 示 。 整 个 软件 开发 过 程 类 似 于 一 个 瀑布 ， 这 就 是 著名 的 “瀑布 软件 
开发 模型 。 
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图 A-2 ”瀑布 软件 开发 模型 
软件 需求 方 期 望 仅 使 用 一 次 瀑布 模型 ， 就 得 到 软件 的 最 终 版 本 。 这 种 模型 很 快 成 为 整 
个 软件 行业 的 一 个 事实 标准 ， 被 广泛 应 用 ， 它 以 “ 重 过 程 、 重 文档 ”的 方式 出 现 ， 软 件 团 
队 的 组 织 结 构 和 角色 职责 也 相对 明确 ， 如 图 A-3 所 示 。 
分 析 开发 7 测试 ”AZ 八 运 维 


电 总 总 
/ A 
y eS 
0 

可 交付 的 


需求 
软件 。 ”运行 的 
系统 
图 A-3 边界 分 明 的 团队 协作 


然而 大 家 并 没有 注意 到 Royce 在 文章 中 给 出 的 提醒 ， 那 就 是 “如 果 使 用 这 种 软件 开发 
模式 管理 软件 项 目 ， 对 同一 个 软件 ， 最 好 能 够 选 代 两 次 ， 第 一 次 使 用 它 先 做 出 一 个 软件 原 
型 ， 第 二 次 再 使 用 它 开 发 出 这 个 软件 的 最 终 正式 版 本 。 ”也 就 是 说 ， 软 件 项 目 第 一 次 使 用 
瀑布 模型 的 目的 并 不 是 开发 出 可 以 直接 生产 的 软件 系统 ， 而 是 为 了 快速 了 解 真实 的 软件 需 
求 和 解决 方案 可 行 性 。 
因为 瀑布 模型 一 次 性 成 功 必须 满足 3 个 前 提 条 件 ， 即 在 软件 开发 过 程 中 能 够 保证 : 
(1) 正在 着 手 解决 的 业务 问题 是 已 知 且 确定 不 变 的 ， 
(2) 业务 问题 的 软件 解决 方案 是 可 预知 且 确 定 不 变 的 ， 
(3) 构建 软件 的 技术 方案 是 明确 且 没 有 未 知 项 的 。 
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不 幸 的 是 ， 这 3 个 前 提 条 件 都 具有 不 确定 性 。 由 于 既 和 掌握 计算 机 软件 开发 ， 又 对 业务 
领域 知识 比较 了 解 的 通用 型 人 才 相 对 有 限 ,， 因 此 能 够 将 业务 问题 描述 清楚 并 将 其 转化 为 软 
件 需求 文档 就 是 一 个 难题 。 另 外 ， 训 练 有 素 且 有 经 验 的 软件 开发 者 也 相对 较 少 ， 无 法 确保 
第 二 和 第 三 个 前 提 的 成 立 。Standish Group 的 Chaos Report 证 明 ， 软 件 项 目的 一 次 性 成 功率 
远 低 于 建筑 工程 项 目 。 


A.2 二 次 进化 : 敏捷 开发 


随 着 硬件 的 发 展 , 微型 计算 机 的 应 用 普及 ，20 世 纪 80 年 代 后 , 软件 需求 爆发 性 增长 。 此 
时 , 一 个 大 规模 软件 常常 由 数 百 万 行 代码 组 成 , 数 以 百 计 的 程序 员 参 与 其 中 。 如何 才能 高 效 、 
可 靠 地 构造 和 维护 这 样 大 规模 的 软件 成 为 了 一 个 新 的 难题 。《 人 月 神话 》 一 书 的 作者 Brooks 
在 该 书 中 提 及 ，IBM 公 司 开 发 的 OS/360 系 统 共 有 4000 多 个 模块 ， 约 100 万 条 指令 ， 投 入 5000 
人 年 , 耗资 数 亿 美元 , 结果 还 是 延期 交付 。 在 交付 使 用 后 的 系统 中 仍 发 现 大 量 (2000 个 以 上 ) 
的 错误 。 很 多 软件 工程 师 对 “瀑布 开发 模型 ”这 种 重文 档 、 重 流程 的 软件 工程 方法 提出 了 质 
疑 , 并 根据 各 自 经 验 , 提出 了 很 多 不 同 的 软件 开发 方法 。 这 些 方 法 均 是 以 “ 迭 代 & 增 量 开 发 ” 
(Iterative & Incremental Development，ID ) 为 基本 思想 的 ， 这 种 思想 可 以 追溯 到 20 世 纪 S0 年 
代 。 根 据 Craig Larman 和 Victor R. Basili 发 表 的 “Tterative and Incremental Development: A Brief 
History”( 友 代 增 量 开发 简 史 ) 所 述 ， 杰 拉 尔 德 温 伯 格 (Gerald M. Weinberg) 曾 说 过 ,“ 早 
在 1957 年 ， 当 时 在 IBM 的 Service Bureau Corporation 的 Bernie Dimsdale 的 领导 下 ， 我 们 就 在 使 
用 增 量 开发 方法 ， 他 是 冯 . 诺 依 曼 的 同事 ， 可 能 是 从 他 那里 学 来 的 ， 或 者 是 自然 发 生 的 。” 


A.2.1 前 奏 一 一 螺旋 模型 


1988 年 ，Barry Boehm 正 式 发 表 了 “螺旋 模型 。 它 将 瀑布 模型 和 快速 原型 模型 结合 起 
来 ， 强 调 了 其 他 模型 所 忽视 的 风险 分 析 ， 它 兼顾 了 快速 原型 的 迭代 的 特征 以 及 瀑布 模型 的 
系统 化 与 严格 监控 。 螺 旋 模 型 最 大 的 特点 在 于 引入 了 其 他 模型 不 具备 的 风险 分 析 ， 使 软件 
在 无 法 排除 重大 风险 时 有 机 会 停止 ， 以 减 小 损失 。 同 时 ， 在 每 个 迭代 阶段 构建 原型 是 螺旋 
模型 用 以 减 小 风险 的 途径 。 螺 旋 模 型 更 适合 大 型 且 昂 贵 的 系统 级 软件 应 用 。 

20 世 纪 90 年 代 ， 先 后 又 出 现 了 多 种 轻 量 级 软件 开发 方法 〈 见 图 A-4)。 轻 量 级 ”一 词 
是 与 “ 课 布 开发 ”这 个 重量 级 方法 相 比 而 言 的 。 
A.2.2 ”敏捷 宣言 的 诞生 

2000 年 春 ，Kent Beck 组 织 了 一 次 研讨 会 ， 地 点 在 俄 勒 内 州 的 罗 格 里 夫 酒店 ， 参 会 者 包 
括 极 限 编程 的 支持 者 们 和 一 些 “ 圈 外 人 ”。 在 罗 格 里 夫 会 议 上 , 与 会 者 们 都 表示 支持 这 些 “ 轻 


量 级 ”软件 开发 方法 ， 但 没有 发 表 什 么 正式 声明 。2001 年 2 月 11 日 至 13 日 ， 在 美国 犹他 州 瓦 
了 萨 奇 山 雪 鸟 请 雪 胜 地 , JeffSutherland, Ken Schwaber Martin folwer 和 Alistair Cockburn 等 17 人 又 
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聚 到 一 起 ， 讨 论 了 各 自 提 出 的 那些 轻 量 级 软件 开发 方法 的 异同 点 ， 希 望 总 结 出 它们 的 共性 ， 
以 及 与 重量 级 瀑布 方法 的 不 同 之 处 。 参 会 者 们 包括 来 自 极限 编程 、Scrum、 动 态 软件 开发 方 
法 、 自 适应 软件 开发 、 水 晶 系列 方法 、 特 性 驱动 开发 、 实 效 编程 的 代表 们 ， 还 包括 希望 找到 
“文档 驱动 、 重 型 软件 开发 过 程 ”替代 品 的 一 些 推动 者 。 会 议 的 最 终 成 果 就 是 《敏捷 软件 开 
发 宣言 》， 如 图 A-5 所 示 。 同 时 还 总 结 了 敏捷 软件 开发 方法 的 十 二 原则 ， 它 们 包括 : 








评估 备 选 方案 ， 
识别 、 解 决 风险 


风险 分 析 
风险 分 析 










需求 计划 
生命 周期 








下 一 阶段 


下 一 级 的 产品 


图 A-4 ”软件 开发 螺旋 模型 













我 们 正在 通过 亲身 实践 以 及 帮助 他 人 实践 ， 揭 示 
更 好 的 软件 开发 方法 ， 通 过 这 项 工作 ， 我 们 认为 ; 


个 体 与 交互 流程 与 工具 

可 以 工作 的 软件 申 面面俱到 的 文档 
客户 合作 ”合同 谈判 

响应 变化 遵循 计划 


虽然 右 项 也 具有 价值 ， 
但 我 们 认为 左 项 具有 更 大 的 价值 。 









图 A-5 ”敏捷 宣言 
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从 这 一 历史 事件 可 以 看 出 ， 我 们 常常 提 到 的 “敏捷 软件 开发 方法 "， 从 诞生 之 日 起 ， 
就 不 是 一 种 软件 开发 方法 ， 也 不 是 一 种 体系 完整 的 方法 论 ， 它 是 满足 上 述 宣 言及 原则 的 一 
徐 轻 量 级 软件 开发 方法 的 集合 ， 如 图 A-6 所 示 。 








图 A-6 ”敏捷 开发 方法 外 
为 了 方便 起 见 ， 如 无 特别 说 明 ， 本 书 中 出 现 的 “敏捷 软件 开发 方法 ”是 指 那些 符合 敏 
宣言 和 十 二 原则 的 方法 ， 以 及 后 续 的 演进 方法 。 
(1) 尽早 地 持续 交付 有 价值 的 软件 ， 以 便 让 客户 满意 ， 这 是 最 高 优先 级 的 事情 。 
(2) 即便 在 开发 阶段 后 期 , 也 欢迎 需求 变化 。 为 了 让 客户 获得 业务 竞争 优势 ， 利 用 敏 


捷 过 程 来 应 对 变化 。 

(3) 频繁 交付 可 工作 的 软件 ， 建 议 采 用 较 短 的 交付 周期 (通常 是 几 周 或 一 两 个 月 )。 

(4) 在 整个 项 目 过 程 中 ， 业 务 人 员 和 开发 人 员 每 天 能 够 一 起 工作 一 段 时 间 。 

(5) 围绕 积极 的 个 体 ， 建 立项 目 团队 。 给 他 们 需要 的 环境 和 支持 ， 并 相信 他 们 能 够 完 
成 工作 。 

(6) 无 论 团队 内 外 ， 传 递 信 息 效果 最 好 和 效率 最 高 的 方式 是 面对面 地 交谈 。 

(7) 可 工作 的 软件 是 项 目 进度 的 首要 衡量 标准 。 

(8) 敏捷 过 程 促 进 可 持续 发 展 。 项 目 主要 干系 人 、 开 发 人 员 和 用 户 应 该 能 一 直 保 持 


























9) 持续 关注 技术 卓越 和 良好 的 设计 ， 提 高 敏捷 性 。 
10) 以 简洁 为 本 ， 它 是 极力 减少 不 必要 工作 量 的 艺术 。 
1) 最 好 的 架构 、 需 求 和 设计 会 从 自 组 织 团队 中 涌现 。 
12) 团队 要 定期 地 反思 “如 何 变 得 更 有 成 效 ? “， 然 后 相应 地 调整 自身 行为 。 
在 这 一 矮 软 件 开发 方法 中 ， 有 两 种 方法 值得 注意 ， 它 们 分 别 是 Scrum 和 极限 编程 
(eXtreming Programming)。 因 为 当代 软件 开发 过 程 中 ， 总 能 看 到 与 它们 相关 的 软件 开发 与 


管理 实践 。 
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1. Scrum 框 架 

1993 年 ，Jeff Sutherland 和 Ken Schwaber 正 式 提 出 Scrum， 它 是 一 种 敏捷 流程 框架 ， 而 
不 是 一 个 开发 完整 产品 的 完整 流程 ， 该 框架 如 图 A-7 所 示 。 其 核心 思想 最 早出 现 于 1986 年 
《哈佛 商业 评论 》 的 一 篇 题 为 “New New Product Development” 的 文章 。 文 章 指出 ， Nonaka 
和 Takeuchi 用 橄榄 球 的 比喻 来 强调 团队 的 重要 性 ， 以 及 在 新 的 复杂 项 目的 开发 过 程 中 如 何 
能 够 表现 更 出 色 。 他 们 的 研究 成 果 为 Scrum 提 供 了 一 些 基 本 概念 ， 包 括 小 型 自 组 织 团队 、 
共同 的 目标 、 自 治 和 跨 职 能 。Scrum 的 价值 观 包括 承诺 、 勇 气 、 聚 焦 、 开 放 和 尊重 。 


每 日 立会 (Daily Scrum) 
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图 A-7” Scrum 框架 





2. 极限 编程 方法 

1999 年 ，Kent Back 编 写 的 《解析 极限 编程 》(Extreme Programming Explained) 一 书 第 
1 版 出 版 ， 标 志 着 该 方法 的 正式 出 现 ， 它 的 价值 观 包括 沟通 、 简 单 、 反 馈 和 勇气 。 它 以 软 
件 工程 实践 而 闻名 ， 如 持续 集成 、 测 试 驱动 开发 、 结 对 编程 和 简单 设计 等 。 它 共 包 含 12 大 
实践 , 分别 是 : 

(1) 完整 团队 ， 

(2) 用 户 故 事 (user story ) ; 

(3) 短 交付 周期 ， 

(4) 客户 验收 测试 ， 

(5) 结对 编程 ， 

(6) 测试 驱动 开发 (Test-Driven Development，TDD ) ; 

(7) 代码 集体 所 有 制 |; 

(8) 持续 集成 ， 

(9) 40 小 时 工作 制 ， 

(10) 开放 的 工作 空间 ， 
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(11) 简单 设计 ， 

(12) 重 构 。 

在 这 12 个 实践 中 ， 与 技术 相关 的 工程 实践 占 了 一 半 ， 从 中 可 以 看 出 ， 对 软件 代码 质量 
的 关注 度 非常 高 。 

A.2.3 ”敏捷 软件 开发 方法 的 演化 

在 “敏捷 ”这 把 大 伞 下 ， 社 区 也 不 断 繁 染发 展 ， 这 些 开 发 方法 之 间 彼 此 吸收 借鉴 ， 不 
断 自我 进化 。 例 如 ， 自 2008 年 起 ，Scrum 将 极限 编程 方法 中 的 数 个 工程 实践 纳入 Scrum 实 践 
之 中 。 

Scrum 框 架 因 其 管理 框架 简单 易 懂 , 并 有 良好 的 商业 化 生态 体系 (授权 认证 体系 )， 而 
受到 广泛 关 广 。 同 时 ， 为 了 适应 不 同 的 组 织 环境 和 不 同 领域 的 软件 特点 ， 很 多 软件 开发 方 
法 论 研究 者 以 Scrum 为 基础 ， 开 发 出 了 不 同 的 软件 开发 框架 ， 具 有 代表 性 的 有 Scrumban、 
SAFe 和 LeSS 。 

1. Scrumban 框 架 

2009 年 Corey Ladas 在 《Scrumban》 一 书 中 提出 了 Scrumban 软 件 管 理 框架 。 它 是 一 个 敏 
捷 的 管理 方法 论 , 是 Scrum 和 看 板 方法 的 混合 框架 , 最 初 是 一 种 从 Scrum 过 渡 到 看 板 方法 的 
方式 。 现 在 的 建议 是 当 团 队 使 用 Scrum 作 为 他 们 选择 的 工作 方式 时 ， 可 以 使 用 看 板 方法 作 
为 团队 工作 透明 化 的 方法 ， 用 来 观察 、 理 解 并 不 断 改进 他 们 的 工作 方式 。 

2. SAFe 框 架 

2011 年 ，Dean Leffingwell 在 其 网 站 上 正式 发 布 了 规划 敏捷 框架 (Scaled Agile 
Framework， 简 写 为 SAAFe) 的 第 一 个 版 本 。 它 旨 在 促进 多 个 敏捷 团队 之 间 的 协调 、 合 作 和 
交付 ， 堂 试 解 决 将 敏捷 工作 方式 扩大 到 整个 企业 范围 后 遇 到 的 一 些 困 难 和 问题 ， 它 常 被 看 
作 是 企业 层面 的 Scrum。 其 主要 知识 体系 输入 为 敏捷 软件 开发 、 精 益 产 品 开发 和 系统 思考 。 

目前 ， 最 新 的 一 个 版 本 叫 作 “SAFe 4.0 forLean Software and Systems Engineering”， 它 
的 主要 变化 包括 : 

e 支持 软件 开发 和 系统 开发 ( 软 硬 件 开发 ); 

e 新 的 价值 流 层 次 ， 包 括 构建 大 型 系统 的 新 的 角色 、 活 动 和 制品 (artifact) ; 

e 全 局 蓝图 更 简洁 和 轻 量 化 ， 同 时 可 以 扩展 以 适应 大 型 价值 流 和 复杂 系统 开发 的 需要 ; 

e 企业 级 的 Kanban 系 统 ， 以 管理 各 层级 的 工作 流 (manage the flow of work ) ; 

e 新 的 项 目 组 合 、 投 资 组 合 层级 的 元 素 ， 包 含 与 企业 战略 的 关联 ， 协 调 组 合 内 的 价 

值 流 等 ， 

e 企业 价值 流 用 相互 连接 的 Kanban 系 统 进行 管理 ， 这 样 有 助 于 可 视 化 工作 及 限制 在 

制品 (limit work in process)， 并 加 快 价值 交付 的 持续 流转 ， 

e 更 新 的 SAFe 需 求 模型 (requirements model) 以 更 好 地 反映 额外 待 办 项 (backlog items ) ; 
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e 更 新 的 内 建 质量 实践 〈builtin quality， 之 前 叫 code quality， 即 代码 质量 ) ， 以 适应 
软件 和 系统 开发 ; 

e 提供 了 一 个 新 的 层 一 一 基础 层 (Foundation Layer)。 

3. LeSS 框 架 

2013 年 ，Large-Scale Scrum (LeSS) 这 个 名 称 被 正式 确立 ， 它 是 一 个 软件 产品 开发 
架 ， 通过 扩展 规则 和 指导 原则 扩展 了 Scrum， 而 不 失 Scrum 的 原始 目的 。 其 创造 者 Craig 
Larman 和 Bas Vodde 称 ， 自 2005 年 开始 ， 他 们 就 根据 自己 的 经 验 ， 总 结 并 提出 了 这 个 框架 ， 
帮助 一 些 企业 进行 敏捷 转型 ， 特 别 是 在 电信 和 人 金融 行业 。 

LeSS 的 目标 是 “降低 ”组 织 的 复杂 性 ， 也 就 是 说 ， 消 除 不 必要 的 复杂 组 织 解 决 方案 ， 
并 以 更 简单 的 方式 解决 它们 ， 如 更 少 的 角色 、 更 少 的 管理 层级 以 及 更 少 的 组 织 结构 。 

这 个 框架 分 为 两 个 层次 : 第 一 个 层次 是 为 多 达 8 个 团队 设计 的 ， 第 二 个 层次 被 称 为 
“Less Huge”， 为 上 百 个 开发 人 员 的 情况 引入 了 一 些 额 外 的 扩展 要 素 。 

4. Nexus 

Nexus 是 开发 和 维护 大 型 软件 开发 项 目的 一 种 框架 ,于 2015 年 发 布 。Nexus 指 南 已 经 包 
含 了 40 种 以 上 的 实践 , 可 以 同 Scrum 指 南 一 起 用 于 扩展 Scrum 和 支持 多 个 软件 开发 团队 的 集 
成 工作 。Nexus Ken Schwaber 是 Nexus 指 南 的 作者 以 及 敏捷 宣言 的 最 初 作者 和 签署 者 之 一 ， 
他 也 是 Scrum 联 盟 的 创建 者 。 在 一 次 公开 采访 中 ， 他 指出 : 
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Nexus 指 南 是 Scrum 指 南 的 伴侣 。 它 免费 、 在 线 地 提供 给 大 家 ， 其 描述 了 夹 式 
(clip-on ) 扩展 框架 ， 能 够 促进 3~9 个 Scrum 团 队 (通常 ) 的 工作 集成 ， 用 来 开发 
软件 。 

Nexus 在 范围 、 方 法 和 成 本 上 都 与 其 他 扩展 方法 (如 SAFe、DAD 和 LeSS ) 不 
一 样 。Nexus 仅 仅 是 为 了 解决 扩展 软件 开发 问题 ， 涉 及 产品 待 办 事项 列表 、 预 算 、 
目标 和 范围 。 

Nexus 同 样 也 仅仅 是 一 种 框架 ……Nexus 不 能 保证 成 功 ,但 它 也 不 是 一 种 公式 
化 的 东西 。 为 了 成 功 ， 人 们 需要 以 一 种 最 合适 的 方式 实施 软件 开发 。 个 体 和 交互 
比 流程 和 工具 更 重要 。 





A.2.4 敏捷 软件 开发 方法 小 结 


敏捷 软件 开发 方法 大 多 来 源 于 过 往 实战 经 验 ， 从 实践 中 找到 一 组 模式 , 并 总 结 提炼 而 
成 。 敏 捷 软 件 开 发 方法 强调 跨 职能 小 团队 协作 ， 强 调 与 客户 密切 合作 ， 尽 早 交 付 可 用 的 软 
件 。 每 种 方法 在 实施 层面 上 都 定义 了 自己 的 一 些 执行 实践 或 工作 方式 ， 而 且 ， 更 强调 团队 
协作 、 达 代 开 发 、 不 断 学 习 ， 而 不 是 “重型 方法 论 ” 所 借鉴 的 建筑 工程 管理 领域 的 一 次 成 
型 方式 ， 如 图 A-8 所 示 。 
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人 ~ 人 
迭代 1! 迭代 7 
需 水 各 本 可 | 所 


可 交付 的 软件 
运行 的 系统 
图 A-8 ”强调 短 周期 迭代 与 跨 部 门 协作 的 敏捷 


当然 ， 有 一 些 敏捷 软件 开发 方法 也 从 人 们 的 视线 中 逐渐 消失 (如 水 晶 方 法 、DSDM 和 
RAD) 或 者 正在 消失 (如 极限 编程 )。 但 其 核心 价值 观 已 被 广泛 接受 ， 并 出 现 了 多 种 方法 
的 融合 。 


A.2.5 TPS 启 发 下 的 软件 开发 方法 


大 野 耐 一 应 用 福特 体系 作为 丰田 生产 系统 (Toyota Production System，TPS) 的 基础 ， 
并 把 该 系统 的 根本 界定 为 “绝对 消除 浪费 ”。 这 个 系统 和 它 强 含 的 思想 ， 为 日 本 制造 业 ， 
尤其 是 丰田 公司 , 赢得 了 广泛 的 信誉 。 在 任 一 款 基 于 精益 制造 和 丰田 生产 系统 的 工作 方法 
中 ,精益 已 经 开始 作为 一 个 涵盖 性 的 术语 在 使 用 了 ， 包 括 精益 建造 、 精 益 实 验 室 。 精 益 原 
则 正 被 成 功 应 用 到 产品 设计 、 工 程 、 供 应 链 管理 等 领域 中 ,现在 也 被 应 用 到 软件 开发 领域 
中 了 。 

有 关 精 益 (Lean) 思想 的 历史 根源 可 以 追溯 到 20 世 纪 初 期 。 当 时 福特 汽车 公司 引入 了 
准时 制造 (Just In Time，JIT)。 正 如 Womack 和 Jones 在 1996 年 所 著 的 《精益 思想 》 (Lean 
Thinking) 一 书 中 描述 的 那样 ， 精 益 制 造 的 所 有 基本 原则 都 在 福特 的 《我 的 生活 与 工作 》 
(1922)、《 今 天 和 明天 》(1926) 和 《向 前 进 》(1930) 中 出 现 过 。 

1. 精益 软件 开发 方法 

2003 年 ，Tom 夫 妇 通 过 研究 丰田 生产 系统 和 精益 思想 ， 并 将 精益 思想 应 用 于 软件 开发 
过 程 , 出 版 了 Lean Sofiware Development: 4An Agile Toolkit 一 书 , 标志 着 “精益 软件 开发 方法 ” 
(lean software development) 正式 诞生 。 

严格 地 说 , 精益 软件 开发 方法 并 没有 包含 明确 的 开发 流程 与 实践 , 而 是 以 精益 思想 关 
指导 ， 提 出 了 软件 开发 中 的 7 项 原则 ， 它 们 分 别 是 : 〈1) 消除 浪费 ，(2) 内 建 质量 ，(3) 
创建 知识 ，(4) 推迟 决策 ，(5) 快速 交付 ; (6) 对 人 尊重 ，(7) 整体 优化 。 

同时 它 也 定义 了 软件 开发 中 的 7 种 浪费 (1) 软件 缺陷 ，(2) 未 被 使 用 的 特性 ，(3) 
避免 任务 传递 ，(4) 延迟 反馈 ; (5) 半成品 (包括 未 实现 的 需求 、 未 测试 的 代码 、 没 有 修 
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复 的 错误 );(6) 任务 切换 ，(7) 不 必要 的 流程 (如 没有 产 出 的 评审 、 编 写 没有 人 读 的 文 
档 、 原 本 简单 却 搞 得 很 复杂 的 流程 等 )。 

2. 看 板 方法 

David Anderson 受 The Principles of Product Development Flow: Second Generation Lean 
Product Development 一 书 作者 的 影响 ， 将 其 中 思想 应 用 于 IT 项 目 ， 并 结合 丰田 生产 方式 中 
的 看 板 实 践 和 约束 理论 , 提出 了 “看 板 方法 ”。2010 年 ，David Anderson 出 版 了 《看 板 方法 》 
一 书 。 他 在 书 中 还 描述 了 这 种 方法 的 演进 过 程 ， 从 2004 年 微软 公司 的 一 个 项 目 使 用 约束 理 
论 ， 到 2006 年 在 Corbis 公 司 的 一 个 项 目 中 ， 算 是 正式 使 用 了 看 板 方法 。 

看 板 方法 将 软件 开发 过 程 视 为 一 种 价值 流 ， 并 且 相 信 拉 动 式 的 管理 能 产生 更 好 的 结 
果 。 严格 来 说 , 它 并 不 是 一 种 软件 开发 方法 , 而 是 以 渐进 方式 指导 企业 变革 的 一 种 方法 论 ， 
其 奇妙 之 处 在 于 它 与 企业 原 有 的 开发 流程 无 颖 结合, 通过 限制 在 制品 的 数量 等 一 系列 简单 
可 行 的 技巧 ， 发 现 和 缓解 软件 开发 过 程 中 的 压力 和 瓶颈 ， 提 高 生产 效率 。 


A.3 三 次 进化 : DevOps 
































上 面 提 到 各 种 敏捷 开发 方法 , 其 诞生 的 环境 大 多 数 是 面向 企业 应 用 的 定制 软件 开发 项 
目 ， 由 于 企业 相关 审计 或 其 他 原因 ， 这 类 软件 的 发 布 特点 是 两 次 版 本 发 布 之 间 的 时 间 间 隔 
较 长。 因此 ， 前 后 两 个 版 本 之 间 的 功能 差异 也 会 较 大 s 在 这 种 情况 下 ， 软 件 交 付 经 常 都 会 
遇 到 “最 后 一 公里 ”问题 。 也 就 是 说 ， 从 软件 功能 开发 完成 到 正式 上 线 这 段 过 程 中 ( 即 集 
成 测试 与 上 线 部 署 阶段 ) 存 在 着 高 度 不 确定 性 和 不 可 控 性 ， 经 常 出 现 “ 项 目 进度 到 百 分 之 
九 十 后 开始 停滞 ,要 花 很 长 时 间 和 很 大 代价 (其 至 超过 前 百 分 之 九 十 所 花费 的 工时 、 工期) 
才能 完成 最 后 的 百 分 之 十 ”。 

尽管 敏捷 软件 开发 方法 强调 欠 代 模式 ,但 多 被 应 用 于 整个 软件 开发 项 目 中 的 前 期 ,其 
解决 问题 的 焦点 更 多 地 关注 于 软件 产品 的 需求 分 析 和 代码 研发 阶段 。 因 此 ， 我 们 常会 看 到 
一 种 现象 , 也 就 是 说 , 声称 已 经 敏捷 转型 的 软件 企业 仍旧 保持 着 原 有 的 开发 节奏 。 事实 上 ， 
他 们 在 瀑布 软件 开发 模型 中 ， 仅 在 开发 阶段 引入 迭代 管理 以 及 相关 的 一 些 敏捷 开发 实践 。 
而 在 最 后 的 集成 测试 阶段 ,仍旧 常常 面临 “最 后 一 公里 ”问题 ， 导 致 项 目 周期 不 可 控 。 在 
软件 部 署 与 发 布 时 仍旧 如 临 大 敌 ， 其 至 要 求全 员 随 时 待命 。 尽 管 如 此 ， 仍 常 被 各 种 始 料 未 
及 的 问题 搞 得 手忙脚乱 。 

A.3.1 DevOps 运 动 的 兴起 


随 着 互联 网 的 过 勃发 展 ， 创 业 大 潮 兴 起 ， 众 多 互联 网 创业 公司 兴起 ， 这 也 给 软件 开发 
带 来 了 新 的 挑战 。 与 前 面 的 挑战 不 同 的 是 : 企业 定制 软件 开发 的 需求 提出 者 是 明确 的 ， 其 
困难 在 于 软件 交付 者 对 于 业务 领域 并 不 了 解 。 对 于 互联 网 软件 服务 ， 甚 困难 在 于 服务 对 象 
是 海量 用 户 ， 并 没有 明确 的 需求 代表 ， 因 此 用 户 需 求 准备 捕捉 更 加 困难 。 因 此 将 软件 快速 
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部 署 上 线 ， 收 集 用 户 的 真实 反馈 成 为 互联 网 业务 的 一 大 诉求 。 

2008 年 ， 以 提倡 “ 短 和 迭代 ， 快 反馈 ”为 主要 软件 交付 形式 的 敏捷 浪 讲 尚未 被 行业 完全 
吸收 ， 第 三 次 进化 “DevOps” 已 经 悄悄 来 临 。Patrick Debois 在 敏捷 2008 大 会 (多伦多 站 ) 
上 提出 “敏捷 基础 设施 与 运 维 "。2009 年 的 Velocity 大 会 上 一 场 名 为 “每 天 10 次 部 署 : 开发 
与 运 维 在 Flickt 的 协作 ”的 演讲 引发 了 整个 行业 的 再 一 次 思考 。 在 这 场 演 讲 中 ，John 和 Paul 
首次 将 部 署 发 布 这 一 环 市 提 到 了 软件 全 生命 周期 中 更 加 重要 的 位 置 。 

2009 年 底 Patrick Debois 举 办 了 一 次 名 为 “DevOpsDays” 的 研讨 会 ， 并 创造 了 这 个 专 
有 名 词 “DevOps"。 它 由 “development”( 开 发 ) 和 “operation”( 运 维 ) 这 两 个 英文 单词 
的 部 分 字母 拼接 而 成 。 由 此 不 难 想象 ， 其 最 初 是 关于 倡导 “开发 ”和 “ 运 维 ”紧密 协作 的 
运动 ， 正 是 希望 消除 由 于 部 门 壁垒 带 来 的 部 署 瓶 颈 。 

2011 年 ， 维 基 百 科 上 对 其 定义 是 “DevOps 是 用 于 加 强 开发 部 门 、 运 维 部 门 和 质量 保 
证 部 门 之 间 询 通 、 协 作 和 集成 的 一 系列 过 程 、 方 法 和 系统 。 它 强调 开发 和 运 维 之 间 相 互 依 
赖 ， 以 实现 及 时 发 布 软件 ， 达成 企业 业务 目标 "， 如 图 A-9 所 示 。 而 2017 年 ， 维 基 百 科 上 对 
其 定义 则 是 :“DevOps 是 以 统一 软件 开发 和 软件 运 维 为 目标 的 一 种 软件 工程 文化 与 实践 。 









































图 A-9 ”IT 部 门 内 的 DevOps 协 作 


就 像 10 年 前 的 “敏捷 "， 现 在 的 “DevOps” 已 经 是 一 个 非常 流行 的 词汇 ， 其 定义 也 在 
不 断 地 变化 ， 并且 没 有 一 个 完全 统一 的 定义 ,似乎 每 个 人 对 其 有 不 同 的 理解 ， 小 到 一 套 方 
法 与 实践 ， 大 到 整个 软件 组 织 的 文化 与 管理 。 这 也 充分 说 明了 人 们 对 它 寄托 的 期 望 ， 它 所 
倡导 的 思想 理念 也 快速 升温 。 
A.3.2 持续 交付 的 诞生 

2010 年 出 版 的 《持续 交付 》 一 书 详细 讲述 了 如 何 实现 以 较 快 的 速度 、 较 低 的 成 本 和 风 
险 , 缩短 从 代码 提交 到 上 线 发 布 的 实践 , 成 为 DevOps 可 以 真正 落地 的 抓 手 。 这 本 书 的 出 版 
也 标志 着 “持续 交付 ”这 一 专 有 名 词 的 诞生 ， 书 中 盖 述 了 实现 上 述 目标 的 一 系列 原则 与 众 
多 实践 。 该 书 作者 之 一 Jez Humble 当 时 正在 主导 持续 集成 与 发 布 管理 平台 GoCD (2008 一 
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2010 年 期 间 ， 名 为 Cruise) 的 产品 研发 ， 书 中 很 多 实践 来 自 这 个 团队 。 
《持续 交付 》 一 书 中 ， 持 续 交 付 被 描述 为 “一 种 能 力 ， 即 能 以 一 种 可 持续 的 方式 ， 将 
所 有 类 型 的 变更 安全 且 迅 速 地 交 给 客户 或 发 布 上 线 ， 无 论 这 些 变更 是 新 特性 、 配 置 变更 ， 
还 是 已 修复 的 缺陷 ,或 者 新 的 测试 实验 。 它 的 目标 是 高 质量 、 低 风险 地 快速 发 布 软件 价值 ”。 
其 核心 模式 是 部 署 流 水 线 ， 核 心 原则 包括 : 
质量 内 建 (built quality in ) ; 
小 批量 开发 (work in small batches ) ; 
尽 可 能 将 所 有 事情 自动 化 ， 让 计算 机 做 重复 的 事情 ， 而 人 来 解决 问题 ; 
持续 不 断 且 不 遗 余力 地 改进 ， 
软件 交付 是 所 有 人 的 责任 。 
Jez Humble 认 为 ， 持 续 交 付 的 3 个 支柱 是 配置 管理 、 持 续集 成 和 持续 测试 。 


A.4 小 结 


这 么 多 的 概念 与 方法 论 之 间 ， 有 着 千 丝 万 缕 的 联系 (如 图 A-10 所 示 )， 并 共同 见证 了 
软件 工程 领域 的 进化 。 时 代 的 车 轮 还 在 向 前 ， 期 待人 工 智 能 带 来 软件 工程 领域 的 革命 。 
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精益 软件 开发 一 > 看 板 / 


说 明 : [XXXX! 非 软件 开发 方法 。 YYYY 淡化 了 的 软件 开发 方法 ”一 > 借鉴 、 吸 收 或 扩展 
图 A-10 软件 工程 方法 编 年 简 史 
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方法 为 我 个 人 的 工作 经 验 总 结 ， 并 于 2011 年 发 表 于 国内 知名 技术 新 闻 网 站 InfoQ 

中 文 站 。 由 于 本 书 中 的 两 个 案例 (第 15 章 和 第 16 章 ) 中 都 使 用 过 该 方法 ， 因 此 
对 其 进一步 修订 ， 作 为 本 书 附录 ， 以 便于 读者 翻阅 。 如 果 希 望 查看 原文 ， 请 移 步 到 技术 新 
闻 网 站 InfoQ。 


B.1 排序 法 相对 估算 


软件 项 目的 估算 历来 是 一 个 难题 , 它 还 无 法 像 做 土建 工程 那样 通过 预算 速 查 手册 来 评 
佑 。 但 是 ,为 了 资源 的 最 大 化 利用 ， 协 调 多 个 团队 的 协作 效率 ， 向 客户 做 出 合同 承诺 ， 软 
件 项 目 都 有 必要 做 工作 量 估 算 。 本 文 主要 讨论 敏捷 软件 开发 中 的 用 户 故 事 (user story) 估 
算 ， 其 以 需求 拆 分 为 前 提 条 件 ， 也 就 是 说 ， 一 个 需求 文档 已 经 被 拆 分 成 多 个 细 粒 度 的 需求 
描述 。 关 于 如 何 拆 分 以 及 拆 分 粒度 的 要 求 ， 参 见 第 6 章 。 

工作 量 估算 方法 有 很 多 ， 但 大 体 上 分 为 绝对 估算 和 相对 估算 。 在 本 文中 ,“ 绝 对 估算 ” 
就 是 指 以 绝对 时 间 (如 小 时 或 天 ) 为 单位 进行 估算 。 而 “相对 估算 ”就 是 通过 用 户 故 事 之 
间 的 大 小 对 比 进行 估算 ， 估 算 后 的 结果 没有 时 间 单 位 〈 它 们 之 间 的 差异 不 在 本 文 讨论 范围 
之 内 )。 在 相对 估算 方法 中 ， 也 有 很 多 种 不 同方 式 。 

1. 相对 估算 的 难点 

相对 估算 的 过 程 中 常常 会 出 现下 面 的 现象 ， 尤 其 是 对 那些 第 一 次 使 用 相对 估算 的 团队 : 

。 当 确 定 相对 估算 的 基准 单位 “1” 时 ， 开 发 人 员 很 难 找 到 一 个 合适 的 用 户 故 事 做 基 












































准 ， 

e 开发 人 员 更 关注 于 讨论 单个 用 户 故 事 的 点 数 是 多 少 ， 而 不 是 关注 与 其 他 用 户 故事 
比较 的 相对 大 小 ， 

e 估算 所 花费 的 总 时 间 比 较 长 (常常 是 整个 下 午 ， 其 至 一 天 )。 

2. 使 用 目标 


当 软 件 项 目 工作 量规 模 较 大 时 ， 在 启动 软件 开发 之 前 制订 发 布 计划 。 
3. 曾 使 用 过 的 场景 
项 目 规模 较 大 (1~3 个 月 的 周期 ), 已 根据 用 户 故事 的 拆 分 原则 (INVEST 原 则 ) 得 到 
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一 个 用 户 故 事 列 表 ， 该 列表 由 各 角色 共同 讨论 过 ， 且 对 每 个 用 户 故事 的 内 容 已 达成 共识 。 
同时 ， 团 队 基 本 上 可 以 保证 : 
。 每 个 卡片 都 会 有 两 个 或 两 个 以 上 的 开发 人 员 了 解 ， 并 有 能 力 开发 ; 
e 开发 人 员 基 本 了 解 每 个 用 户 故 事 的 工作 内 容 。 
4. 该 方法 的 假设 
该 方法 的 假设 具体 如 下 : 
。 用 户 故 事 的 客观 工作 量 不 会 因为 具体 开发 人 员 的 差异 而 不 同 (尽管 人 员 不 同 ， 花 
费 的 时 间 可 能 不 同 )，; 
。 由 于 软件 项 目的 总 用 户 故事 数量 较 多 ,因此 假设 估计 后 的 客观 规模 不 会 偏差 太 多 ， 
e 开发 人 员 是 整个 交付 过 程 的 瓶颈 ， 因 此 仅 由 开发 人 员 估算 其 开发 规模 ， 不 包括 用 
户 故 事 的 测试 规模 。 


B.2 相对 排序 法 的 操作 过 程 


下 面 来 介绍 一 下 相对 排序 法 的 操作 过 程 。 
1. 第 一 步 : 准备 工作 
一 个 大 会 议 室 
全 体 开发 人 员 到 场 
待 估算 的 所 有 用 户 故事 写 在 卡片 上 (只 写 坟 句 话 需求 ,< 并 确保 所 有 人 能 看 慌 ) 

e 透明 胶带 〈 用 于 将 卡片 贴 在 白板 上 或 墙 上 ) 

2. 第 二 步 : 初步 排序 

(1) 将 卡片 按 个 数 均 分 给 每 个 参与 项 目的 开发 人 员 ; 

(2) 让 一 个 开发 人 员 取 一 张 卡片 A， 贴 到 墙 上 (随便 哪 张 都 可 以 )，; 

(3) 让 每 个 开发 人 员 将 手中 的 卡片 与 已 经 贴 墙 上 的 所 有 卡片 进行 对 比 ， 按 下 面 的 规则 
贴 在 墙 上 相应 的 位 置 。 

e 如 果 和 手中 的 卡片 与 墙 上 A 的 工作 量 大 小 相当 ， 就 将 其 贴 在 卡片 A 的 下 方 ， 

e。 如 果 和 手中 的 卡片 比 卡片 A 工作 量 大 ， 就 将 其 贴 在 A 的 右 侧 ， 

e 如 果 和 手中 的 卡片 比 卡片 A 工作 量 小 ， 就 将 其 贴 在 A 的 左 侧 ， 

e 如 果 C 的 工作 量 大 小 在 A 和 B 之 间 ， 就 把 它 放 在 A 和 B 之 间 。 

以 此 类 推 ， 如 图 B-1 所 示 ，4 个 卡片 的 工作 量 大 小 关系 为 A<C= D<B。 

在 这 个 过 程 中 ， 可 以 让 所 有 开发 人 员 同 时 贴 卡片 ， 只 要 彼此 不 和 干涉， 保持 独立 判断 
即 可 。 

当 全 部 卡片 贴 完 以 后 , 再 请 全 体 开发 人 员 重 新 看 一 看 ,是 不 是 每 个 卡片 的 位 置 都 很 适 
当 ， 如 图 B-2 所 示 。 
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图 B-1 卡片 按 工作 量 大 小 排列 
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图 B-2 初步 排序 的 结果 








3. 第 三 步 : 讨论 差异 

如 果 对 某 个 卡片 的 位 置 有 异议 , 请 拿 出 来 讨论 。 这 也 许 是 因为 大 家 对 它 的 内 容 和 理解 
不 一 致 造成 的 。 因 此 需要 对 其 进行 深入 讨论 ， 直 至 一 致 认为 它 应 该 在 哪 一 列 为 止 。 需要 注 
意 的 是 ， 不 要 试图 讨论 精确 的 工作 量 ， 只 需要 相对 准确 即 可 。 

4. 第 四 步 : 确定 工作 量 大 小 刻度 

使 用 数字 1, 2, 3, 5, 8, 13 或 1, 2, 4, 8, 16 按 顺序 将 其 放 在 有 对 比 关系 的 列 上 。 图 B-3 中 ， 
列 在 2 下 面 的 的 每 个 故事 卡片 ， 其 工作 量 大 小 应 该 是 列 在 1 下 面 的 一 倍 左 右 。 
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图 B-3 ”确定 工作 量 大 小 刻度 
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5. 第 五 步 : 归并 调整 

对 于 那些 列 头 上 还 没有 数字 标识 的 列 〈 如 图 B-3 中 “K” 列 、“C” 列 和 “ 工 ” 列 ) ， 请 
开发 人 员 根 据 其 工作 量 大 小 的 接近 程度 将 其 放 到 相 邻 的 列 中 ， 可 能 向 左 移动 ， 也 可 能 向 右 
移动 ， 如 图 B-4 所 示 。 这 时 团队 成 员 间 还 会 发 生 对 一 些 卡片 的 工作 量 大 小 进行 讨论 ， 有 可 
能 也 进行 位 置 调整 。 
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图 B-4 调整 后 的 工作 量 大 小 排序 


最 后 ， 将 每 列 的 用 户 故事 数量 与 列 头 的 数字 相 乘 筷 得 到 的 数字 再 相 加 以 后 ， 就 得 到 该 
项 目的 总 体 规模 。 

6. 使 用 注意 事项 

使 用 相对 排序 法 的 操作 过 程 有 以 下 儿 个 注意 事项 。 

(1) 在 估算 之 前 ， 应 该 确保 所 有 用 户 故 事 之 间 的 规模 差异 不 要 过 大 。 例 如 ， 某 个 用 户 
故事 大 约 需 要 一 个 小 时 完成 ， 而 另 一 个 用 户 故 事 则 需要 两 周 。 此 时 说 明 ， 用 户 故 事 的 粒度 
不 合理 ， 不 符合 INVEST 原 则 中 的 S 原 则 ， 小 的 需求 可 能 需要 与 其 他 需求 合并 ， 而 大 的 需求 
一 定 需要 拆 分 。 

(2) 如 果 各 列 卡 片 的 数量 不 符合 正 态 分 布 ， 而 是 两 头 的 卡片 多 ， 中间 的 卡片 少 ， 也 说 
明 用 户 故 事 粒 度 可 能 有 问题 ， 需 要 重新 审视 一 下 。 

(3) 如 果 在 一 列 中 有 数 个 相关 联 且 同样 大 小 的 故事 〈 如 支持 银联 卡 、 支 持 MasterCard、 
支持 VISA 卡 ) ， 且 先 做 完 一 个 卡片 ， 其 他 两 个 工作 量 会 减少 的 情况 下 ， 可 以 将 任意 一 个 放 
在 当前 列 ， 其 他 两 个 可 以 考虑 放 在 比较 小 的 一 列 中 。 但 是 ， 具 体 情 况 还 是 要 具体 分 析 ， 因 
为 实际 情况 较 复杂 。 但 在 整体 审视 环节 中 ， 这 类 的 分 析 和 验证 工作 不 可 缺少 。 

(4) 在 讨论 和 移动 卡片 时 ， 应 该 更 多 地 与 其 他 卡片 进行 对 比 ， 而 不 是 直接 说 某 个 卡 
片 属于 哪 一 数字 列 。 因 为 列 头 的 数字 都 是 相对 值 ， 没 有 其 他 卡片 的 对 比 ， 这 些 数字 没有 
意义 。 


(5) 在 讨论 的 过 程 中 ,会 捕捉 到 一 些 之 前 没有 发 现 的 问题 或 信息 ， 此 时 一 定 要 及 时 记 
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录 下 来 。 对 于 不 清楚 的 问题 ， 应 该 当场 由 业务 人 员 给 出 结论 。 
(6) 这 种 方法 在 那些 没有 尝试 过 相对 估算 的 团队 中 首次 使 用 时 ， 最 好 能 有 一 定 经 验 的 
人 加 以 引导 ， 对 已 排 定 的 顺序 进行 适当 验证 。 


B.3 小 结 


对 刚刚 接触 敏捷 软件 开发 方法 的 团队 来 说 , 这 种 规模 估算 和 计划 的 方法 的 确 不 太 容 易 
接受 ， 尤 其 是 在 那些 已 习惯 于 使 用 WBS 分 解 方式 做 计划 的 团队 中 ， 他 们 会 纠结 于 “1” 到 
底 代表 多 长 时 间 ， 是 代表 资深 开发 人 员 的 一 天 ， 还 是 新 手 的 一 天 。 

如 前 所 述 ， 这 种 排序 法 有 其 前 提 条 件 与 假设 。 在 进行 用 户 故 事 拆 分 时 ， 需 要 进行 充分 
的 讨论 ， 让 团队 成 员 了 解 每 个 用 户 故 事 ， 这 是 该 方法 成 功 的 前 提 (关于 需求 拆 分 的 原则 与 
方法 参见 第 6 章 )。 当 然 ， 充 分 沟通 也 是 敏捷 软件 开发 方法 成 功 的 前 提 。 


























持续 交付 2.0 


本 书 分 三 个 部 分 : 第 一 部 分 作者 根据 自己 
近 十 年 的 工作 及 咨询 经 历 ， 对 原 有 的 持续 交付 
进行 了 修正 ， 将 持续 交付 重新 定义 为 实现 组 织 
战略 目标 的 能 力 ， 并 引入 持续 交付 的 能 力 模 
型 ， 第 二 部 分 阐述 组 织 打 造 持续 交付 能 力 所 需 
遵守 的 原则 ， 包 括 基 础 原则 、 组 织 原 则 和 架构 
原则 ; 第 三 部 分 通过 多 个 案例 解读 ， 阐 述 如 何 
根据 组 织 的 当前 状况 和 应 用 原则 ， 并 对 最 佳 实 
践 进 行 取舍 ， 快 速达 到 组 织 能 力 目标 。 
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